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* 用 轻松 幽默 的 语言 介绍 Python 基础 知识 、 高 级 用 法 以 及 在 十 多 个 领域 的 应 用 。 

。 书 中 近 200 个 案例 代码 和 超过 1000 个 演示 性 代码 片段 都 配 有 大 量 注释 ， 方 便 阅 读 和 理解 。 
。 提供 全 套 课 件 和 所 有 案例 ( 包括 作者 编写 的 一 个 课堂 教学 管理 与 在 线 考试 系统 ) 的 源 代码 。 
* 可 以 通过 QQ 、 微 信 、 微 信 公 众 号 、 电 子 邮 箱 等 方式 随时 与 作者 交流 。 
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内 容 简 介 


全 书 共 分 16 章 , 对 Python 内 部 工作 原理 进行 了 一 定 深度 的 剖析 ,99% 以 上 的 案例 代码 使 用 Python 
3.5.1 实现 ,也 适用 于 Python 3. 4. x( 除 少数 几 个 新 特性 之 外 ) 和 最 新 版 本 Python 3. 5. 2 以 及 Python 
3. 6.0, 极 个 别 案例 使 用 Python 2. 7. 11 实现 (同样 适用 于 其 他 版 本 Python 2. 7. x, 包 括 最 新 的 Python 
2.7.12) ,适当 介绍 了 Python 代码 优化 .系统 编程 和 安全 编程 的 有 关 知 识 ,满足 不 同 层次 读者 的 需要 。 
另外 , 书 中 通过 小 提示 ,小 技巧 .注意 拓展 知识 等 形式 介绍 了 更 多 的 内 容 , 全 部 内 容 远 比 章节 目录 所 显示 
的 要 多 ,需要 认真 阅读 才能 真正 领会 其 中 的 奥妙 。 

本 书 适合 作为 Python 程序 员 的 开发 指南 ,也 可 以 作为 高 等 院 校 计算 机 专业 、 软 件 工 程 专 业 等 专业 
的 Python 教材 ,还 可 以 作为 Python 爱好 者 的 指导 用 书 。 
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多 FOREWORD 


Python 并 不 是 一 门 新 语言 , 它 由 Guido van Rossum 于 1989 年 年 底 开 始 设计 ,并 于 
1991 年 推出 第 一 个 公开 发 行 版 本 , 比 Java 早 4 年 。Python 推出 不 久 就 迅速 得 到 各 行业 
人 士 的 青睐 ,经 过 20 多 年 的 发 展 ,已 经 渗透 到 统计 分 析 、 移 动 终端 开发 .科学 计算 可 视 化 、 
系统 安全 、 逆 向 工程 ,软件 测试 与 软件 分 析 、 图 形 图 像 处 理 、 人 工 智 能 、 机 器 学 习 、 游 戏 设计 
与 策划 、 网 站 开发 .数据 仆 取 与 大 数据 处 理 、 密 码 学 、 系 统 运 维 、 音 乐 编程 .影视 特效 制作 、 
计算 机 辅助 教育 、 医 药 辅 助 设计 、 天 文 信息 处 理 、 化 学 、 生 物 信息 处 理 、 神 经 科学 与 心理 学 、 
自然 语言 处 理 、 电 子 电路 设计 .电子 取证 、 树 莓 派 等 几乎 所 有 专业 和 领域 ,在 黑客 领域 更 是 
多 年 来 一 直 拥有 霸主 地 位 。 

作为 一 个 非常 不 完整 列表 ,这 里 给 出 几 个 Python 应 用 案例 : 3E 5 18 3 9| ÓK Google 
的 核心 代码 使 用 Python 实现 ,迪士尼 公司 的 动画 制作 与 生成 采用 Python 实现 ,大 部 分 
UNIX 和 Linux 操作 系统 都 内 建 了 Python 环境 支持 , 豆 辩 网 使 用 Python 作为 主体 开发 
语言 进行 网 站 架构 和 有 关 应 用 的 设计 与 开发 ,网 易 大 量 网 络 游戏 的 服务 器 端 代码 超过 
70% 采 用 Python 进行 设计 与 开发 , 易 度 的 PaaA 企业 应 用 云端 开发 平台 和 百度 云 计算 平 
台 BAE 也 都 大 量 采 用 了 Python 语言 ,eBay 已 经 使 用 Python 超过 15 年 以 上 (在 eBay 官 
方 宣布 支持 Python 之 前 就 已 经 有 程序 员 在 使 用 了 ), 美 国字 航 局 使 用 Python 实现 了 
CAD/CAE/PDM 库 及 模型 管理 系统 ,微软 集成 开发 环境 Visual Studio 2015 开始 默认 支 
持 Python 语言 而 不 需要 像 之 前 的 版 本 一 样 再 单独 安装 PTVS 和 IronPython, 开 源 ERP 
系统 Odoo 完全 采用 Python 语言 开发 , 树 莓 派 使 用 Python 作为 官方 编程 语言 ,引力 波 数 
据 是 用 Python 进行 处 理 和 分 析 的 ,YouTube、 美 国 银行 等 也 在 大 量 使 用 Python 进行 开 
发 ,类 似 的 案例 数不胜数 。 

早 在 多 年 前 Python 就 已 经 成 为 卡耐基 梅 隆 大 学 、 麻 省 理工 学 院 、 加 州 大 学 伯克利 分 
校 , 哈 佛 大 学 、 多 伦 多 大 学 等 国外 很 多 大 学 计算 机 专业 或 非 计算 机 专业 的 程序 设计 入 门 教 
学 语言 , 近 几 年 来 国内 也 有 不 少 学 校 的 多 个 专业 陆续 开设 了 Python 程序 设计 课程 。 
Python 语言 连续 多 年 在 TIOBE 网 站 的 编程 语言 排行 榜 上 排名 七 八 位 ,2011 年 1 月 
Python 被 TIOBE 网 站 评 为 2010 年 年 度 语言 ;在 2014 年 12 月 份 IEEE Spectrum 推出 的 
编程 语言 排行 榜 中 ,Python 取得 了 第 5 位 的 好 名 次 ;2015 年 12 月 份 TIOBE 编程 语言 排 
行 榜 上 Python 跃 居 第 4 位 , 仅 次 于 Java C 和 C++, 已 经 成 为 脚本 语言 的 标准 ; Top 
developer Languages of 2015 更 是 把 Python 排 到 了 第 3 位 。 

Python 是 一 门 和 免费 开源 的 跨 平 台 高 级 动态 编程 语言 ,支持 命令 式 编程 函数 式 编 
程 ,完全 支持 面向 对 象 程序 设计 ,拥有 大 量 功 能 强大 的 内 置 对 象 、 标 准 库 、 涉 及 各 行业 领域 
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的 扩展 库 以 及 众多 狂热 的 支持 者 ,使 得 各 领域 的 工程 师 、 科 研 人 员 、 策 划 人 员 甚 至 管理 人 
员 能 够 快速 实现 和 验证 自己 的 思路 、 创 意 或 者 推测 。 在 有 些 编程 语言 中 需要 编写 大 量 代 
码 才 能 实现 的 功能 ,在 Python 中 直接 调用 内 置 函 数 或 标准 库 方法 即 可 实现 ,大 幅度 简化 
了 代码 的 编写 和 维护 。Python 用 户 只 需要 把 主要 精力 放 在 业务 逻辑 的 设计 与 实现 上 ,在 
开发 速度 和 运行 效率 之 间 达 到 了 完美 的 平衡 ,其 精妙 之 处 令 人 击 节 装 叹 。 


如 何 学 习 Python 


要 想 改变 世界 ,首先 要 改变 自己 的 世界 。 要 想 学 好 Python, 首 先 要 从 内 心 认识 到 
Python 的 强大 与 美 , 树 立 起 学 好 、 用 好 Python 的 信念 并 坚持 不 懈 的 努力 ,然后 才 有 可 能 
3E Python & f 2 M. 

很 多 人 从 内 心 很 恐惧 Python ,曾经 有 不 少 人 问 我 :“Python 功能 那么 强大 ,肯定 很 难 
学 吧 ?” 其 实 , 从 编程 语言 发 展 史 来 看 ,人 类 语言 和 机 器 语言 之 间 的 鸿沟 越 来 越 小 ,人 机 交 
互 越 来 越 方便 , 越 高 级 的 编程 语言 越 接近 人 类 自然 语言 , 越 容易 学 习 、 掌 握 和 运用 ,所 以 请 
不 要 有 丝毫 的 恐惧 和 犹 耶 ,放手 去 学 便 是 。 

以 我 个 人 20 年 的 经 验 , 不 管 学 习 和 使 用 哪 种 编程 语言 ,大 概 都 需要 经 历 4 个 阶段 : 
第 一 阶段 ,能 看 懂 和 调试 别人 的 代码 ;第 二 阶段 ,能 在 别人 的 代码 基础 上 进行 适当 改写 ;第 
三 阶段 ,能 把 多 段 已 有 的 代码 拼凑 起 来 实现 自己 需要 的 功能 ;第 四 阶段 ,自己 动手 编写 代 
码 实现 特定 功能 需求 。 一 般 而 言 ,如 果 每 天 坚持 3 个 小 时 学 习 Python, 两 周 左右 应 该 就 
能 入 门 ,3 个 月 后 就 可 以 展示 出 不 错 的 成 果 。 当 然 , 随 着 学 习 和 开发 时 间 越 来 越 长 ,功力 
会 越 来 越 深 厚 , 能 够 掌控 的 代码 行 数 (LOC) 会 越 来 越 多 ,能 够 控制 的 业务 逻辑 越 来 越 
复杂 。 

毫 无 疑问 ,Python 是 一 门 快乐 .优雅 的 语言 ,上 手 非 常 容易 , 稍 加 接触 就 会 喜欢 上 
Python 并 能 够 在 短 时 间 内 写 出 几 个 小 程序 。 与 C 语言 系列 和 Java 等 语言 相 比 ,Python 
大 幅度 降低 了 学 习 与 使 用 的 难度 。Python 易学 易 用 ,语法 简洁 清晰 ,代码 可 读 性 强 ,编程 
模式 非常 符合 人 类 思维 方式 和 习惯 。 尽 管 如 此 ,但 这 并 不 代表 可 以 毫 不 费力 地 学 会 和 熟 
练 运用 Python, 在 学 习 Python 的 路 上 没有 秘籍 ,也 没有 哈 利 波 特 魔法 杖 ,唯一 的 捷径 就 
是 勤学 苦 练 。 

多 看 。 读 书 破 万 卷 ,下 笔 如 有 神 。 学 习 Python 也 是 这 样 ,不 仅 要 多 看 书 , 还 要 看 很 
多 遍 。 很 多 知识 点 是 互相 关联 的 ,单独 一 个 知识 点 也 无 法 实现 稍微 复杂 一 点 的 功能 , 书 中 
很 多 案例 代码 用 到 了 后 面 章 节 的 知识 点 ,而 后 面 章节 的 案例 代码 又 用 到 了 前 面 章节 的 内 
容 , 这 实在 是 无 法 避免 的 一 件 事 。 因 此 ,不 能 奢望 看 一 遍 就 能 熟悉 和 掌握 书 中 的 内 容 , 更 
不 能 奢望 只 看 一 本 书 就 能 学 会 Python 的 全 部 知识 。 以 我 个 人 而 言 ,除了 Python 官方 帮 
助 文档 和 一 些 社区 的 资料 之 外 ,已 经 阅读 了 超过 25 本 Python 方面 的 书 ,并 且 还 在 不 断 地 
购买 和 阅读 别人 编写 的 Python 书籍 来 提高 自己 对 Python 的 理解 。 一 书 一 茶 一 下 午 ,这 
样 平淡 的 快乐 或 许 有 人 难以 体会 ,于 我 却 是 乐此不疲 。 

多 练 。 太 极 源 论 日 “由 招 熟 而 渐 悟 懂 劲 ,由 懂 劲 而 阶 及 神明 , 然 非 用 力 之 久 , 不 能 争 然 
贯通 看 ”。 陆 游 的 教子 诗 《 冬 夜 读 书 示 子 幸 》 也 认为 “ 纸 上 得 来 终 觉 浅 , 绝 知 此 事 要 躬 行 ”。 
掌握 了 正确 的 方法 以 后 ,多 练 是 唯一 的 捷径 。 一 定 要 动手 编写 和 调试 书 上 的 代码 ,路 踏实 
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实 把 基础 掌握 好 再 有 针对 性 地 学 习 自 己 需要 的 扩展 库 , 切 尽 只 看 不 练 。 很 多 人 了 眼 高 手 低 ， 
一 看 就 会 ,一 编 就 错 ,根本 原因 就 是 练 得 太 少 了 。 子 日 “学 而 时 习 之 ”, 也 是 这 个 道理 ,充分 
说 明 练 习 的 重要 性 。 一 层 功夫 一 层 天 。 欲 穷 千 里 目 ,更 上 一 层 楼 。 多 练 ,可 以 说 是 攀登 
Python 高 手 之 匮 最 重要 的 途径 。 

多 想 。 学 而 不 思 则 周 , 思 而 不 学 则 殖 。 一 味 地 看 书 和 埋头 苦 练 是 不 行 的 ,还 要 多 想 、 
多 总 结 、 多 整理 ,争取 把 学 到 的 知识 和 技术 彻底 理解 。 理 解 得 越 多 ,需要 记忆 的 就 越 少 。 

多 交流 。 独 学 而 无 友 , 则 和 孤 陋 而 寡 闻 。 除 了 重视 基础 知识 的 学 习 和 练习 之 外 ,还 要 多 
交流 。 除 了 Python 官方 网 站 和 在 线 帮 助 文档 之 外 ,经 常 浏览 一 些 Python 论坛 并 阅读 和 
调试 其 中 的 优秀 代码 ,汲取 他 人 代码 中 的 精华 。 子 日 “三 人 行 必 有 我 师 钼 , 择 其 善 者 而 从 
之 ”, 也 是 相同 的 道理 。 遇 到 不 懂 的 问题 也 可 以 去 一 些 论坛 发 帖 提问 ,或 者 请 教 身边 的 朋 
友和 老师 ,但 是 提问 之 前 一 定 要 充分 思考 ,有 针对 性 地 请 教 别人 ,经 过 充分 思考 以 后 再 请 
教 别人 不 仅 是 对 别人 的 尊重 ,也 能 让 自己 有 更 大 的 收获 。 百 思 不 得 其 解 的 问题 经 过 高 手 
一 点 拨 才 能 有 苏 塞 顿 开 和 忱 然 大 悟 的 效果 ,这 样 的 交流 更 加 有 效 , 不 浪费 彼此 的 时 间 。 曾 
经 有 学 生 拿 一 个 十 几 页 代码 的 程序 来 问 我 问题 ,我 问 哪里 看 不 懂 , 他 说 整个 程序 都 看 不 
懂 , 想 让 我 帮忙 看 看 然后 把 整 篇 代码 给 他 讲 讲 。 正 如 大 家 所 想 的 一 样 ,我 直接 拒绝 了 他 。 
也 曾经 有 读者 问 我 “怎么 用 Python 做 图 像 处 理 ?” 真 的 很 抱歉 ,这 样 没 营养 的 问题 我 实在 
没 法 回答 。 

俗话 说 ,心急 吃 不 了 热 豆腐 。 控 制 好 学 习 的 进度 和 节奏 才能 获得 最 好 的 效果 ,每 天 学 
习 一 点 、 进 步 一 点 、 提 高 一 点 ,时 间 久 了 会 突然 有 一 天 发 现 自己 已 经 成 为 Python 高 手 ,很 
有 零 存 整 取 的 感觉 。 欲 速 则 不 达 , 把 下 面 这 个 图 送 给 各 位 读者 朋友 共勉 。 


学 拳 容易 改 源 难 。 不 是 所 有 慢 和 悠悠 的 拳 都 是 太极 拳 ,也 不 是 所 有 用 Python 语言 写 
出 来 的 代码 都 足够 Pythonic。 很 多 人 认为 编程 语言 都 是 一 通 百 通 ,无 非 是 语法 不 一 样 而 
已 ,认为 “ 没 吃 过 猪肉 也 见 过 猪 跑 ” ,简单 看 看 语法 就 能 立刻 使 用 另外 一 种 语言 编写 程序 。 
这 样 的 想法 确实 有 一 定 的 道理 ,但 实际 上 就 算 天 天 看 猪 跑 也 没 法 知道 猪肉 是 哈 味 道 , 按 照 
C 语言 的 思路 用 Python 写 出 来 的 代码 绝对 不 是 好 的 Python 程序 ,会 显得 不 伦 不 类 ,代码 
会 非常 哆 唆 , 不 得 Python 精 禾 ,完全 不 能 发 挥 Python 的 优势 。 应 该 在 熟悉 Python 编程 
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模式 的 基础 上 ,尽量 尝试 从 最 自然 .最 简洁 的 角度 出 发 去 思考 和 解决 问题 ,这 样 才能 写 出 
更 加 优雅 .更 加 Pythonic 的 代码 , 像 诗 一 样 美 。 

汝 果 欲 学 诗 , 功 夫 在 诗 外 。 没 有 丰富 的 人 生 阅 历 很 难 写 出 优美 并 且 有 内 涵 、 有 灵魂 的 
诗 , 学 习 Python 也 是 这 样 。 归 根 到 底 ,Python 是 用 来 表达 我 们 思想 、 算 法 或 帮 有 我 们 解决 
某 个 问题 的 语言 和 工具 而 已 ,idea 才 是 一 个 程序 的 灵魂 。 切 不 可 把 全 部 精力 放 到 Python 
语言 本 身 的 学 习 上 ,而 是 要 把 主要 精力 放 到 自己 的 专业 知识 学 习 上 ,最 终 再 用 Python 把 
自己 的 思想 或 算法 准确 地 表达 出 来 。 本 书 从 不 同 领域 选取 了 一 些 有 代表 性 的 案例 ,同时 
还 结合 自己 多 年 的 项 目 开发 和 教学 经 验 整理 和 设计 了 一 些 案例 ,希望 能 够 起 到 抛砖引玉 
的 作用 。 


内 容 组 织 与 阅读 建议 


对 于 Python 程序 员 来 说 ,熟练 运用 优秀 、 成 熟 的 扩展 库 可 以 快速 实现 业务 逻辑 和 创 
意 ,而 Python 语言 基础 知识 和 基本 数据 结构 的 熟练 掌握 则 是 理解 和 运用 其 他 扩展 库 的 
必要 条 件 。 并 且 , 在 实际 开发 中 建议 优先 使 用 Python 内 置 对 象 和 标准 库 对 象 实 现 预 定 
功能 ,这 样 可 以 获得 更 高 的 执行 效率 。 本 书 前 7 章 使 用 大 量 篇 幅 介 绍 Python 编程 基础 知 
识 , 通 过 大 量 案例 演示 Python 语言 的 精妙 与 强大 。 然 后 从 第 8 章 开 始 介绍 大 量 标准 库 和 
扩展 库 在 GUI 编程 .网 络 编程 .数据库 编程 大 数据 处 理 、 多 线程 与 多 进程 编程 .系统 运 
维 、 图 形 图 像 编程 、 科 学 计算 可 视 化 、 密 码 学 编程 .移动 终端 编程 等 多 个 领域 的 应 用 。 最 后 
一 章 通过 一 个 完整 的 系统 演示 了 Python 在 实际 系统 开发 中 的 应 用 。 全 书 共 16 章 , 读 者 
在 熟练 掌握 前 7 章 之 后 ,可 以 结合 自己 的 专业 领域 或 兴趣 爱好 ,在 其 他 章节 中 有 选择 地 进 
行 阅读 。 

第 1 章 Python 基础 。 介 绍 如 何 选 择 Python 版 本 和 开发 环境 ,Python 对 象 模型 ， 
数字 、 字 符 串 等 基本 数据 类 型 ,运算 符 与 表达 式 , 常 用 内 置 函 数 , 基 本 输入 输出 函数 ,扩展 
库 管 理 与 使 用 。 

第 2 章 Python 序列。 讲解 序列 常用 方法 和 基本 操作 ,列表 基本 操作 与 常用 方法 ， 
切片 操作 ,列表 推导 式 , 元 组 与 生成 器 推导 式 , 序 列 解 包 , 字 典 、 集 合 基本 操作 与 常用 方法 ， 
字典 推导 式 与 集合 推导 式 。 

第 3 章 程序 控制 结构 与 函数 设计 。 讲 解 Python 选择 结构 、for 循环 与 while 循环 ， 
带 else 子 名 的 循环 结构 ,break 5 continue 语句 ,循环 代码 优化 ,函数 定义 与 使 用 ,关键 参 
数 、 默 认 值 参 数 、 长 度 可 变 参数 等 不 同 参数 类 型 ,全 局 变量 与 局 部 变量 ,参数 传递 时 的 序列 
解 包 ,return 语句 ,lambda 表达 式 以 及 map() ,reduceO \filter()、 生 成 器 与 可 调用 对 象 。 

第 4 章 面向 对 象 程序 设计 。 讲 解 类 的 定义 与 使 用 ,self 与 cls 参数 ,类 成 员 与 实例 
成 员 , 私 有 成 员 与 公有 成 员 , 继 承 与 派生 ,属性 ,特殊 方法 与 运算 符 重 载 等 内 容 , 以 及 自 定 
义 类 实现 数组 和 矩阵、 队列 、 栈 、 二 叉 树 \ 有 向 图 、 集 合 等 数据 结构 。 

第 5 章 字符 串 与 正则 表达 式 。 讲 解 字符 串 编 码 格式 ,字符 串 格式 化 替换、 分 割 、 连 
接 、 查 找 、 排 版 等 基本 操作 ,正则 表达 式 语法 、 正 则 表达 式 对 象 . 子 模 式 与 子 模式 扩展 语法 、 
match 对 象 ,以 及 Python 正则 表达 式 模块 re 的 应 用 。 

第 6 章 文件 与 文件 夹 操作 。 讲 解 文件 操作 基本 知识 ,Python 文件 对 象 ,文本 文件 
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读 写 操作 ,二 进 制 文件 读 写 与 对 象 序 列 化 ,文件 复制 .移动 、 重 命名 ,文件 类 型 检测 ,文件 完 
整 性 检查 ,压缩 与 解压 缩 , 文 件 夹 大 小 统计 ,文件 夹 增 量 备 份 ,删除 指定 类 型 的 文件 ,以 及 
word、excel、zip、apk、rar 等 常见 文件 类 型 的 操作 。 

第 7 章 异常 处 理 结构 、 代 码 测试 与 调试 。 讲 解 Python 异常 类 层次 结构 与 自 定义 异 
常 类 ,多 种 不 同形 式 的 异常 处 理 结构 ,使 用 IDLE 和 pdb 模块 调试 Python 程序 ,Python 
单元 测试 相关 知识 。 

第 8 章 数据 库 应 用 开发 。 介 绍 SQLite 数据 库 及 其 相关 概念 ,Connection 对 象 、 
Cursor 3X! & , Row 对 象 , 使 用 Python 操作 Access, MS SQL Server, MySQL 等 关系 型 数 
据 库 以 及 使 用 Python 操作 NoSQL 数据 库 MongoDB, 

第 9 章 网络 应 用 开发 。 讲 解 计算 机 网 络 基 础 知识 ,TCP、UDP 协议 编程 ,网 络 噬 探 
器 与 端口 扫描 器 设计 ,域名 解析 与 网 页 候 虫 设计 原理 ,代理 服务 器 与 FTP 软件 原理 与 实 
现 ,使 用 Python 编写 CGI 程序 ,使 用 Flask 和 django 框架 开发 Web 应 用 ,以 及 使 用 CH 
与 Python 混合 开发 Web 应 用 。 

第 10 章 多 线程 与 多 进程 。 讲 解 Python 标准 库 threading 和 multiprocessing 在 多 
线程 编程 与 多 进程 编程 中 的 应 用 ,以 及 多 线程 与 多 进程 之 间 的 数据 共享 与 同步 控制 。 

第 11 章 大 数据 处 理 。 介 绍 大 数据 处 理 框架 MapReduce, Hadoop 和 Spark 基本 概 
念 ,重点 介绍 MapReduce 和 Spark 应 用 。 

第 12 章 图 形 编程 与 图 像 处 理 。 讲 解 扩展 库 PyOpenGL 在 计算 机 图 形 学 编程 中 的 
应 用 ,扩展 库 pillow 在 图 像 编程 中 的 应 用 。 

第 13 章 数据 分 析 与 科学 计算 可 视 化 。 讲 解 扩展 库 numpy、scipy、matplotlib 在 科 
学 计算 与 可 视 化 领域 的 应 用 ,以 及 标准 库 statistics 与 扩展 库 pandas 在 统计 与 分 析 、 数 据 
处 理 中 的 应 用 。 

第 14 章 密码 学 编程 。 介 绍 恺 撤 密 码 、 维 吉 尼 亚 密码 等 经 典 密码 算法 的 Python 实 
现 ,以 pycrypto、rsa、hashlib 等 模块 为 主讲 解 安全 哈 希 算法 、 对 称 密 钥 密 码 算 法 DES 5 
AES 以 及 非 对 称 密 钥 密 码 算 法 RSA 与 DSA 的 应 用 。 

第 15 章 tkinter 编程 精彩 案例 。 讲 解 如 何 使 用 Python 标准 库 tkinter 进行 GUI 编 
程 ,通过 大 量 实际 案例 演示 基本 组 件 的 用 法 ,包括 用 户 登 录 界 面 设计 、 选 择 类 组 件 应 用 、 简 
单 文本 编辑 器 、 画 图 程序 设计 与 实现 、 电 子 时 钟 、 简 单 动画 、 屏 幕 任意 区 域 截图 、 音 乐 播放 
器 、 远 程 桌面 监控 程序 等 。 

第 16 章 课堂 教学 管理 系统 设计 与 实现 。 通 过 一 个 综合 案例 来 演示 前 面 章节 知识 
的 应 用 ,提供 了 学 生 名 单 和 题库 的 导入 、 在 线 点 名 ,在线 提问 、 在 线 答疑 在 线 收 作业 、 在 线 
自 测 与 考试 、 数 据 导出 、 防 作 准 与 服务 器 自动 发 现 、 信 息 汇 总 、 试 卷 生成 等 功能 。 

本 书 的 最 大 特点 是 信息 量 大 、 知 识 点 紧凑 、 案 例 丰 富 、 注 释 量 大 、 实 用 性 强 ,把 书 中 一 
些 代码 进行 简单 拼凑 就 可 以 满足 实际 工作 中 需要 的 很 多 功能 。 全 书 近 200 个 涉及 不 同行 
业 领 域 的 实用 案例 和 上 千 个 代码 片段 并 且 配 有 大 量 注释 以 方便 理解 ,没有 插入 多 余 的 程 
序 输出 结果 或 软件 安装 截图 ,只 保留 了 必要 的 代码 运行 结果 或 截图 以 供 读者 参考 和 对 比 ， 
充分 利用 宝贵 的 篇 幅 来 介绍 和 演示 尽 可 能 多 的 知识 ,绝对 物 超 所 值 。 本 书 作 者 具有 16 年 
程序 设计 教学 经 验 ,先后 讲授 过 汇编 语言 C/C++ /C# Java, PHP, Python 等 多 门 程序 
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设计 语言 ,并 且 编写 过 大 量 的 应 用 程序 ,其 中 有 几 套 系统 已 投入 使 用 多 年 并 一 直 在 使 用 。 
本 书 内 容 结合 了 作者 多 年 教学 与 开发 过 程 中 积累 的 许多 经 验 和 案例 ,并 巧妙 地 业 合 进 了 
相应 的 章节 。 

本 书 对 Python 内 部 工作 原理 进行 了 一 定 深 度 的 剖析 , 书 中 9996 VA E B9 3E 0025] 6 9 
Python 3. 5. 1 实现 ,这 些 代 码 同样 也 适用 于 Python 3. 4. x( 除 少数 几 个 新 特性 之 外 ,如 矩 
阵 运算 符 @) 和 最 新 版 本 Python 3.5.2 以 及 马上 就 要 正式 面世 的 Python 3. 6.0, 极 个 别 
案例 使 用 Python 2.7.11 实现 (同样 适用 于 其 他 版 本 Python 2. 7. x, 包 括 最 新 的 Python 
2.7.12), 并 适当 介绍 了 Python 代码 优化 .系统 编程 和 安全 编程 的 有 关 知 识 , 可 以 满足 不 
同 层次 读者 的 需要 。 另 外 , 书 中 通过 小 提示 、 小 技巧 注意 ,拓展 知识 等 形式 介绍 了 更 多 的 
内 容 , 所 以 全 部 内 容 远 比 章节 目录 所 显示 的 要 多 ,需要 认真 阅读 才能 真正 领会 其 中 的 
奥妙 。 


配套 资源 


本 书 提供 所 有 案例 源 代码 ,可 以 登录 清华 大 学 出 版 社 网 站 (www. tup. com. cn) FR, 
或 加 入 本 书 读者 群 (QQ 群 号 为 282819961) 下 载 最 新 配套 资源 并 与 作者 直接 交流 ,作者 微 
信号 Python_dfg 也 随时 期 待 您 的 反馈 和 交流 ,当然 也 欢迎 关注 微 信 公众 号 “Python 小 
屋 ” 及 时 阅读 作者 写 的 最 新 案例 代码 。 

本 书 适 用 读者 

本 书 可 以 作为 (但 不 限于 ) 

。 本 科 、 专 科 或 研究 生 程序 设计 课程 教材 。 

* Python 培训 用 书 。 

。 具有 一 定 Python 基础 的 读者 进 阶 首选 学 习 资料 。 
涉及 Python 开发 的 工程 师 、 策 划 人 员 、 科 研 人 员 和 管理 人 员 阅 读书 目 。 
打算 利用 业余 时 间 学 习 一 门 快乐 的 程序 设计 语言 并 编写 儿 个 小 程序 来 娱乐 的 读 
者 首选 学 习 资料 。 
少数 对 编程 具有 浓厚 兴趣 和 天 赋 的 中 学 生 课 外 阅读 资料 。 
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1.1 Python 是 一 种 什么 样 的 语言 


小 时 不 识 月 , 呼 作 白 玉 盘 。 很 多 人 习惯 地 (甚至 还 会 配合 着 鄙夷 的 眼神 和 表情 ?说 
Python 不 过 是 一 种 脚本 语言 而 已 ,实际 上 这 种 说 法 是 非常 不 准确 的 ,完全 不 能 体现 出 
E eee 严格 来 说 ， dg E—DETG JF. Aoc pini ATN 


Hiocsidiwewio on 也 有 人 喜欢 把 S 称 为 胶水 语言 ", 因 为 pdr 
语言 编写 的 程序 融合 到 一 起 实现 无 颖 拼接 ， 更 好 地 发 挥 不 同 语言 和 工具 的 优势 ， 满足 不 同 
应 用 领域 的 需求 。 

Python 官方 网 站 同时 发 行 并 维护 着 Python 2. x 和 Python 3. x 两 个 不 同系 列 的 版 
本 ,目前 的 最 新 版 本 分 别 是 Python 2. 7. 12, Python 3. 5.2 和 Python 3. 6. 0a3。Python 
2. x 和 Python 3. x 这 两 个 系列 的 版 本 之 间 很 多 用 法 是 不 兼容 的 (让 人 欣慰 的 是 ,除了 一 
些 新 特性 、 运 算 符 和 标准 库 对 象 之 外 ,同一 个 系列 的 不 同 版 本 之 间 用 法 大 多 是 一 致 的 ) , 除 
了 输入 输出 方式 有 所 不 同 , 很 多 内 置 函 数 及 标准 库 的 内 部 实现 和 返回 值 类 型 也 有 较 大 的 
区 别 ,不 同 Python 版 本 的 扩展 库 之 间 更 是 差别 巨大 。 众 多 的 Python 及 其 扩展 库 版 本 让 
很 多 新 手眼 花 练 乱 , 仙 怕 还 吓 跑 了 一 些 人 ,不 同 版 本 之 间 的 不 兼容 也 让 不 少 人 感到 很 苦 
恼 , 甚 至 痛苦 。 不 过 稍 加 了 解 和 熟悉 之 后 就 会 发 现 这 并 不 是 什么 问题 ,实际 上 功能 超级 强 
大 的 Python 自 诞生 不 久 就 迅速 得 到 了 各 行 各 业 的 人 士 的 喜爱 。 

我 从 哪里 来 ,要 到 哪里 去 ,这 是 每 个 人 都 应 该 经 常 思考 的 问题 ,人 生 必 须 有 个 明确 的 、 
高 大 上 的 目标 并 且 不 停 地 为 之 而 奋斗 。 同 样 ,在 选择 Python 的 时 候 ,一 定 要 先 考 虑 清楚 
自己 学 习 Python 的 目的 是 什么 ,打算 做 哪 方 面 的 开发 ,有 哪些 扩展 库 可 用 ,这 些 扩展 库 
最 高 支持 哪个 版 本 的 Python。 这 些 问 题 全 部 确定 以 后 ,再 做 出 自己 的 选择 ,这 样 才能 事 
半 功 倍 , 而 不 至 于 把 太 多 时 间 浪 费 在 Python 以 及 各 种 扩展 库 的 反复 安装 和 和 印 载 上 。 另 
外 , 当 较 新 的 Python 版 本 推出 之 后 ,不 要 急于 赶 时 晓 ,看 到 别人 用 高 版 本 的 Python 也 不 
用 自卑 ,而 是 应 该 在 确定 自己 所 必须 使 用 的 扩展 库 也 推出 了 与 之 匹配 的 新 版 本 之 后 再 一 
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起 进行 更 新 。 

目前 来 看 ,Python 3. x 的 设计 理念 更 加 人 性 化 ,全 面 普及 和 应 用 已 经 是 大 势 所 趋 , 越 
来 越 多 的 扩展 库 以 最 快 的 速度 推出 了 与 最 新 Python 版 本 相 适 应 的 版 本 。 如 果 和 暂时 还 没 
想到 要 做 什么 行业 领域 的 应 用 开发 ,或 者 仅仅 是 为 了 尝试 一 种 新 的 .好玩 的 语言 ,那么 请 
毫 不 犹 称 地 选择 Python 3. x 系列 的 最 高 版 本 。 

'O IEREMUR: Python 名 字 的 来 源 : 虽然 在 英语 中 Python 是 大 蟒蛇 的 意思 ， 
Python 语言 却 和 大 蟒蛇 没有 任何 关系 。Python 语言 的 名 字 来 自 于 一 个 著名 的 电视 剧 
(Monty P ython's Flying Circus) .Python 之 父 Guido van Rossum 是 这 个 电视 剧 的 狂热 
爱好 者 ,故此 把 他 发 明 的 语言 命名 为 Python。 

SONER: 由 于 历史 原因 ,短期 内 还 无 法 完全 放弃 Python 2. x, 不 过 预计 在 
2020 年 将 会 退出 历史 舞台 ,Python 3.x 的 全 面 普及 是 个 大 趋势 。 

AMER: 除了 在 IDLE 主 界面 上 可 以 直接 看 到 当前 使 用 的 Python 版 本 号 ( 见 
图 1-1) ,还 可 以 使 用 下 面 的 方法 来 查看 当前 Python 的 版 本 。 


>> > import Platform # 导 人 Python 模 块 platform 
>>>platfom.python version() # 调 用 模块 中 的 函数 
351 

>>> inport sys # 导 人 Python XR. sys 


>>> sys.version 

13.5.1 (v3.5.1:37a072œ2e5969, Dec 6 2015, 01:54:25) [MSC v.1900 64 bit (AMD64) ] ' 

>>> sys.winver 

'3.5' 

>>> sys.version info 

sys.version info(major-3, minor=5, micro= 1, releaselevel- 'final', serial- 0) 

>>> sys.executable # 查 看 Python 主 程序 文件 

'C:\\Python 3.5\\pythonw.exe' 

ANER: 另外 ,sys 模块 还 提供 了 大 量 与 系统 编程 有 关 的 接口 ,后 面 章 节 将 根据 需 
要 进行 展开 介绍 。platform 模块 还 提供 了 一 些 查看 操作 系统 信息 的 函数 ,例如 下 面 的 代码 : 

»»»platfom.win3? ver() 

('7', '6.1.7601', 'SPl', 'Miltiprocessor Free') 

»»»platform.version() 

"6.1.7601" 

»»»platform.machine () 

"AMDGA" 

»»»platfom.python ompiler () 

"MSC v.1900 64 bit (AMD64) ' 


1.2 Python 开发 环境 


120 百家争鸣 的 繁荣 景象 
工 欲 善 其 事 , 必 先 利 其 器 。 学 习 编 程 也 是 同样 的 道理 ,对 开发 环境 的 熟悉 应 该 是 学 习 
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一 门 编程 语言 的 第 一 步 。 

IDLE 是 Python 的 官方 标准 开发 环境 ,从 官方 网 站 www. python. org 下 载 并 安装 合 
适 的 Python 版 本 之 后 ,同时 就 安装 了 IDLE。 相 对 于 其 他 Python 开发 环境 而 言 ,IDLE 
相对 来 说 确实 有 点 简陋 ,但 已 经 具备 了 Python 应 用 开发 的 几乎 所 有 功能 (例如 ,语法 智 
能 提示 、 使 用 不 同 颜色 显 示 不 同类 型 的 内 容 等 ) ,并 且 也 不 需要 过 于 复杂 的 配置 ,因此 得 到 
很 多 人 的 喜爱 。Python 3. 5.1 IDLE 的 界面 如 图 1-1 所 示 。 


Type "copyright", "credits" or "license()" for more information. 
>>> print(* Hello world. 
Hello world. 


图 1-1 Python 3. 5. 1 IDLE 的 界面 


是 的 ,你 没有 看 错 ,输出 了 Hello world, 这 是 我 们 用 Python 编写 的 第 一 段 代 码 ,意味 
着 我 们 进入 到 了 Python 语言 的 世界 , 先 向 新 世界 的 朋友 们 打 个 招呼 。 据 说 某 程序 员 退 
休 之 后 喜欢 上 了 书法 , 买 回来 笔墨 纸 砚 后 沉思 良久 ,然后 在 纸 上 重 重地 写 下 了 Hello 
world ,宣告 自己 正式 进军 书法 界 。 

除了 默认 安装 的 IDLE, 还 有 大 量 的 其 他 IDE. 开发 环境 ,例如 wingIDE, PyCharm, 
PythonWin,Eclipse,Spyder,IPython, Komodo 等 。 不 要 总 去 问 别 人 到 底 哪 个 开发 环境 好 , 因 
为 你 得 到 的 答案 取决 于 你 问 的 是 谁 。 每 个 IDE 都 有 不 同 的 风格 ,也 分 别 得 到 了 不 同 开发 人 
员 的 喜爱 ,但 万 变 不 离 其 宗 , 严 格 来 说 那些 开发 环境 都 是 对 Python 解释 器 python. exe 的 封 
装 ,核心 是 完全 一 样 的 ,只 是 加 了 一 个 外挂? 而 已 ,使 用 起 来 更 加 方便 ,减少 了 出 错 率 ,尤其 
是 拼写 错误 ,而 这 恰恰 是 很 多 程序 员 最 容易 犯 的 一 个 错误 。wingIDE、PyCharm 和 Eclipse 十 
PyDev 等 Python 开发 环境 的 运行 界面 分 别 如 图 1-2 一 图 1-4 所 示 。 


file Edit Source Relator Projet Debug Tsing "och Wincom neip 
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Z| E defprntvaue-" sep" 
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图 1-2 wingIDE 的 运行 界面 
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Ele Edit View Navigate Code Refactor Run Tools VCS Window Help 
D untitled )  indexpy ) Eider) > k| Q 
O Oil] B indexpy > 
vw D untitled (CAUsers Dong PycharmProje Diupert os 
import math 


> MWh External Libraries 
(print (Hello world!') 
print (math. sqrt (9)) 


"C: \Python 3.5\python. exe” C:/Users/Dong/PycharnProjects/untitled/index. py 
Hello world! 
3.0 


Process finished with exit code 0 


1 print(]'heLlo world") 


D 


EJ Console 53 — € 
m XO, RR PEE) ug-n- 
«terminated» C:\Users\Dong\workspace\first\hello.py 


hello world 


图 1-4 Eclipse 十 PyDev 的 运行 界面 


如 果 暂 时 什么 都 不 想 安装 ,只 是 简单 地 想 试 试 Python 好 不 好 玩 , 可 以 试 试 Python 
官方 网 站 (www. python. org) 提 供 的 Interactive Shell, 登录 Python 官方 网 站 之 后 , 单 击 
1-5 中 方 框 内 的 那个 图 标 ( 一 个 大 于 号 和 一 个 下 画 线 ), 然 后 稍 等 片刻 即 可 进入 图 1-6 
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所 示 的 界面 。 
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Python 
Hi, Python. 


图 1-5 Python 官方 网 站 提供 的 Interactive Shell A Fl 


Œ § https;//www.python.org, 


Python 


e? pytho 


About Downloads Documentation 


fault, Dec 18 2015, 00:00:00) 


elp“, g , "credits" or "license" for 
import math 
print(math.sin(2)) 
0.909: 268256817 
»» print('Hello world!') 
Hello world! 


图 1-6 Python 官方 网 站 提供 的 Interactive Shell 界面 


有 不 少 太 极 拳 爱好 者 刚 接触 太极 拳 时 面 对 众 多 的 太极 拳 “ 版 本 ”也 是 一 样 的 困惑 , 杨 
式 、 陈 式 、 孙 式 、 吴 式 \ 武 式 、 赵 堡 等 等 , 杨 式 太极 拳 有 85 35.103 式 、 老 六 路 等 等 , 陈 式 又 有 
洪 传 陈 式 、 混 元 太极 等 等 。 到 底 该 学 哪个 呢 ? 正 所 谓 万 变 不 离 其 宗 , 不 管 选 择 哪 一 个 , 符 
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合 太极 拳 理 才 是 最 根本 的 。 学 好 的 话 , 哪 一 个 都 可 以 成 为 拳 中 之 王 ; 如 果 只 学 个 花架 子 而 
不 得 拳术 精髓 ,学 再 好 的 拳 也 是 徒 有 虚 表 。 与 其 在 众多 的 Python 开发 环境 面前 纠结 先 
择 哪 一 个 ,不 如 马上 行动 起 来 ,尽快 地 确定 一 个 ,然后 熟练 掌握 其 用 法 。 

(以 拓展 知识 : 如 果 有 读者 想 尝试 一 下 在 安 卓 手机 上 编写 Python 程序 ,可 以 安装 支 
持 Python 3. x 的 QPython3 或 者 支持 Python 2. x 的 QPython, 关 于 SL4A 和 安 草 类 库 调 
用 的 相关 知识 可 以 查阅 相关 资料 。 


122 IDLE 简 单 使 用 


本 书 采用 标准 的 IDLE 作为 开发 环境 来 演示 Python 的 强大 功能 ,几乎 所 有 代码 都 可 
以 直接 拿 到 其 他 开发 环境 中 运行 ,不 需要 任何 修改 。 有 时 候 可 能 需要 同时 安装 多 个 不 同 
的 版 本 ,例如 ,同时 安装 Python 2. 7. 11 和 Python 3. 5. 1, 并 根据 不 同 的 开发 需求 在 两 个 
版 本 之 间 进 行 切换 。 多 版 本 并 存 一 般 不 影响 在 IDLE 环境 中 直接 运行 程序 ,只 需要 启动 
相应 版 本 的 IDLE 即 可 。 在 命令 提示 符 环境 中 运行 Python 程序 时 ,在 调用 Python 主 程 
序 时 指定 其 完整 路 径 , 或 者 通过 修改 系统 Path 变量 来 实现 不 同 版 本 之 间 的 切换 。 在 
Win 7 系统 下 修改 系统 Path 变量 的 步骤 如 下 : 单 击 * 开 始 ? 菜 单 , 右 击 * 计 算 机 ?并 选择 
“属性 ”, 单 击 “ 高 级 系统 设置 "切换 至 “高 级 "选项 卡 ,再 单 击 “ 环 境 变 量 " 按 钮 ,然后 修改 系 
统 Path 变量 中 Python 安装 路 径 , 如 图 1-7 所 示 。 


zü [1 S 
WOZ PLUGIN PATH C:\Program Files (x86) Woxit So... 
用 户 配置 文件 PATH 'DATAX\Python\Scripts 
SEWRHAMMEOR| 。 | Ta USEEEFRDPTLEXVNgpDataALocaltTenp 
[8.71709 
Fired ammm] FARBO 
zü [1 a 
Path C:\Python34\:C: \Python34\Script... (I| 
pd COL. EXE; BAT: CD; VIS; VBE: 
PHXMSOR)R.. MMDS4 E 
sasa 
meo C OES 
Windows Update " 
HENES: (ae ][ wá ) 


HUE: - 


1-7 Win 7 环境 中 系统 Path 变量 的 修改 方法 


x 和) 小 提示 : 有 些 Python 程序 需要 在 命令 提示 符 环境 中 运行 。 在 Win 7 系统 中 ,可 
以 依次 单 击 “ 开 始 ”>“ 所 有 程序 ”>“ 附 件 ” 一 “命令 提示 符 ” 进 入 命令 提示 符 环境 ,或 者 单 
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击 “ 开 始 ” 菜 单 然后 在 “搜索 程序 和 文件 ”文本 框 内 输入 cmd 回 车 确定 直接 进入 命令 提示 
符 环境 ,最 后 再 通过 cd 命令 切 挨 至 相应 的 文件 夹 。 也 可 以 参考 1.4.1 节 的 内 容 直 接 进入 
命令 提示 符 环境 并 切换 至 相应 的 文件 夹 。 

如 果 能 够 熟练 使 用 开发 环境 提供 的 一 些 快捷 键 ,将 会 大 幅度 提高 开发 效率 。 在 
IDLE 环境 中 ,除了 撤销 (Ctrl 十 Z) 、 全 选 (Ctrl 十 A)、 复 制 (Ctrl 十 C) 、 粘 贴 (Ctrl 十 V) 、 前 切 
(Ctrl 十 X) 等 常规 快捷 键 之 外 ,其 他 比较 常用 的 快捷 键 如 表 1-1 所 示 。 

表 1-1 IDLE 中 的 常用 快捷 键 
快捷 键 功能 说 明 
Tab 补 全 单词 , 列 出 全 部 可 选单 词 供 选择 
Alt 十 P 浏览 历史 命令 (上 一 条 ) 
Alt--N 浏览 历史 命令 (下 一 条 ) 
Ctrl+F6 | 重启 Shell, 之 前 定义 的 对 象 和 导入 的 模块 全 部 失效 


FI 打开 Python 帮助 文档 
自动 补 全 前 面 曾经 出 现 过 的 单词 ,如 果 之 前 有 多 个 单词 具有 相同 前 级 , 则 在 多 个 单词 
Altt/ | 中 循环 切换 


Ctrl 十 ] 缩 进 代码 块 
Ctrl 十 [ 取消 代码 块 缩 进 
Alt 十 3 注释 代码 块 
Alt 十 4 取消 代码 块 注释 


启动 IDLE 之 后 默认 为 交互 模式 ,直接 在 Python Bb £P" tiii A UST fa 


令 并 回 车 执行 即 可 ,如 果 执 行 顺利 的 话 , 马 上 就 可 以 看 到 执行 结果 ,和 否则 会 提示 错误 或 者 
抛 出 异常 。 


>>>3+5 # 井 号 之 后 的 内 容 是 注释 ,不 会 被 执行 
8 

>>> import math # 导 入 Python 标 准 库 math 
»»»math.sqrt (9) # 使 用 标准 库 函 数 计算 平方 根 

3.0 

>>>9#* 0.5 # 使 用 运算 符 ** 计 算 平方 根 

3.0 

>>>3 * (%6) 

24 

>>>2/0 # 除 0 错误 , 抛 出 异常 , 详 见 第 7 章 


Traceback (most recent call last): 
File "<pyshell#18> ", line 1, in «module» 
2/0 
ZercDivisionError: integer division or modulo by zero 


2»»x-'Hello world # 语 法 错误 ,字符 串 结尾 缺少 一 个 单 引号 
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SyntaxError: EOL while scanning string literal 

LAMER: Python 非常 追求 代码 的 可 读 性 。 很 明显 ,如 果 代码 密密麻麻 地 挤 成 一 
团 肯 定 不 可 能 有 好 的 可 读 性 ,所 以 好 的 Python 代码 在 形式 上 一 般 是 比较 松散 的 ( 形 散 神 
不 散 )。 一 般 来 说 ,建议 在 运算 符 两 侧 和 去 号 后 面 增加 一 个 空格 ,在 不 同 功能 的 代码 块 之 
间 增 加 一 个 空 行 ,这 样 看 起 来 会 更 舒服 一 些 。 

交互 模式 一 般 用 来 实现 一 些 简单 的 业务 逻辑 ,或 者 验证 某 些 功能 。 复 杂 的 业务 逻辑 
更 多 的 是 通过 编写 Python 程序 来 实现 ,同时 也 方便 代码 的 不 断 完 善 和 重复 利用 。 在 
IDLE 界面 中 使 用 菜单 File New File 创建 一 个 程序 文件 ,输入 代码 并 保存 为 文件 (务必 
要 保证 扩展 名 为 . py, 如 果 是 GUI 程序 可 以 保存 扩展 名 为 pyw 的 文件 。 如 果 保 存 为 其 他 
扩展 名 的 文件 ,一 般 并 不 影响 在 IDLE 中 直接 运行 ,但 是 在 “命令 提示 符 ” 环 境 中 运行 时 需 
要 显 式 调用 Python 主 程序 ,并 且 在 资源 管理 器 中 直接 双击 该 文件 时 可 能 会 无 法 关联 
Python 主 程序 从 而 导致 无 法 运行 ) 后 ,使 用 菜单 Run 一 Check Module 来 检查 程序 中 是 否 
存在 语法 错误 ,或 者 使 用 菜单 Run Run. Module 运行 程序 ,程序 运行 结果 将 直接 显示 在 
IDLE 交互 界面 上 。 除 此 之 外 ,也 可 以 通过 在 资源 管理 器 中 双击 扩展 名 为 . py 或 . pyc 的 
Python 程序 文件 直接 运行 ;在 有 些 情况 下 ,可 能 还 需要 在 命令 提示 符 环境 中 运行 Python 
程序 文件 。 在 “开始 ”菜单 的 “附件 ”中 单 击 “ 命 令 提示 符 ”, 然 后 执行 Python 程序 。 例 如 ， 
假设 有 程序 HelloWorld. py 内 容 如 下 : 

def main(): 

print('Hello world') 
main() 
在 IDLE 环境 中 运行 该 程序 结果 如 图 1-8 所 示 。 


>>> — —————Í— RESTART 


>>> 
Hello world 
>>> 


图 1-8 在 IDLE 中 运行 程序 
在 命令 提示 符 环境 中 运行 该 程序 的 方法 与 结果 如 图 1-9 Bros ,该 图 中 演示 了 两 种 执 
行 Python 程序 的 方法 ,虽然 第 二 种 方法 看 上 去 更 加 简单 .但 是 请 尽量 使 用 第 一 种 方法 来 
运行 Python 程序 ,否则 可 能 会 影响 某 些 程序 的 正确 运行 。 


[EL 


:Python35>python helloworld.py 
jello world 


: NPython355hellovorld.py 
jello world 


:NPython35? 


1-9 在 命令 提示 符 中 运行 程序 
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您 注 : 全 书 涉及 命令 提示 符 环境 的 插图 都 尽量 采用 和 白 底 黑 字 而 不 是 默认 的 黑 底 白 
字 , 其 他 插图 也 尽量 采用 浅 色 背 景 ,这 样 可 以 减少 印刷 时 的 用 墨 量 。 

器 + 小 技巧 : 为 提高 代码 运行 速度 ,同时 也 对 Python 源 代码 进行 保密 ,可 以 在 命令 
提示 符 环境 中 使 用 “python -OO -m py. compile file. py” 将 Python 程序 file. py 伪 编 译 成 
为 . pyc 文件 ,选项 -OO 表示 优化 编译 。 

(QARAR: 自 定义 IDLE 清 屏 快捷 键 。 有 不 少 读者 问 我 Python IDLE 有 没有 像 
命令 提示 符 环境 中 cls 那样 的 清 屏 命令 ,能 不 能 一 下 子 删 除 交 互 模式 中 所 有 已 执行 的 命 
令 和 输出 结果 ,毕竟 每 次 都 关 掉 再 重新 打开 DLE 确实 有 点 喝 唆 ,显得 也 没有 技术 含量 。 
IDLE 本 身 并 没有 提供 清 屏 命令 ,但 是 可 以 通过 扩展 来 实现 。 可 以 从 网 上 下 载 
ClearWindow. py( 配 套 资源 里 已 经 提供 了 这 个 文件 ) 并 放 到 Python 安装 路 径 中 的 lib\ 
idlelib 文件 夹 中 ,然后 用 记事 本 打开 文件 lib\idlelib\config-extensions. def, 在 最 后 添加 
以 下 几 行 ; 

[ClearWindow] 

enable=1 

enable editor=0 

enable shell=1 

[Clearmindon cfgBindings] 

clear- window- < Control- Key- ;> 

保存 libVidlelibVconfig-extensions. def 文件 后 重启 一 下 IDLE, 会 发 现 菜单 Options 
下 面 多 了 一 个 可 以 清 屏 的 菜单 项 ,如 图 1-10 所 示 。 另 外 ,也 可 以 随时 使 用 “Ctrl 十 ;” 快 捷 
键 实 现 清 屏 。 当 然 , 这 个 快捷 键 是 可 以 任意 修改 的 ,修改 的 地 方 就 在 上 面 配置 代码 最 后 一 
行 ,看 到 了 吗 ? 那 就 试 试 吧 ,把 它 改 成 自己 喜欢 的 快捷 键 。 


1-10 配置 IDLE 并 增加 清 屏 菜单 和 快捷 键 


1.3 变量 .运算 符 与 表达 式 
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对 象 是 Python 语言 中 最 基本 的 概念 之 一 ,在 Python 中 的 一 切 都 是 对 象 ,常用 的 内 
置 对 象 如 表 1-2 所 示 。 除 此 之 外 ,还 有 大 量 的 标准 库 对 象 和 扩展 库 对 象 ,标准 库 是 
Python 默认 安装 的 ， E A E VRSNRHERIEE 
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况 下 与 对 象 的 概念 不 作 严 格 的 区 分 。 
表 1-2 Python 内 置 对 象 
对 象 类 型 R A 简要 说 明 
数字 1234, 3.14, 1.3e5, 3+4j 数字 大 小 没有 限制 , 且 支 持 复数 及 其 运算 
FAP | swfu', "Im student". "Python" | 使 用 单 引号 、 双 引号 、 三 引号 作为 界定 符 
列表 [1, 2, 3],[a，b', Ce's 2]] 所 有 元 素 放 在 一 对 方 括号 中 ,元 素 之 间 使 用 逗号 分 隔 
sa [users somos T RRZRENESA 
元 组 (2, —5, 6) 所 有 元 素 放 在 一 对 圆 括号 中 ,元 素 之 间 使 用 逗号 分 隔 
文件 f=open('data. dat'，rb) open 是 Python 内 置 函 数 , 使 用 指定 的 模式 打开 文件 
be^ "mE 所 有 元 素 放 在 一 对 大 括号 中 ,元 素 之 间 使 用 逗号 分 

集合 set(abc) {a', b', c) 隔 , 元 素 不 允许 重复 
布尔 型 True, False 
空 类 型 ”| None 

— | 函数 (使 用 def 定义 ) 
编程 单元 类 (使 用 class 定义 ) 类 和 函数 都 属于 可 调用 对 象 


在 Python 中 ,不 需要 事先 声明 变量 名 及 其 类 型 ,直接 赋值 即 可 创建 各 种 类 型 的 对 象 


创建 了 整 型 变量 x, 并 赋值 为 3 ,语句 


»»»x-'Hello world." 


创建 了 字符 串 变量 x, 并 赋值 为 "Hello world. ,语句 


>>> [1, 2, 3] 


创建 了 列表 对 象 x, 并 赋值 为 [1, 2,3]. ix— ex AREH FH, F RA ARK Ae 
Python 任意 类 型 的 对 象 ,以 及 自 定义 类 型 的 对 象 。 
虽然 不 需要 在 使 用 之 前 显 式 地 声明 变量 及 其 类 型 ,但 是 Python 仍 属于 强 类 型 编程 


算 也 不 完全 一 样 , 因 此 在 使 用 变量 时 需要 程序 员 自 己 确 定 所 进行 的 运算 是 否 合适 ,以 免 出 
现 异常 或 者 意料 之 外 的 结果 。 另 外 ,Python 还 是 一 种 动态 类 型 语言 ,也 就 是 说 ,变量 的 类 


型 是 可 以 随时 变化 的 ,下 面 的 代码 演示 了 Python 变量 类 型 的 变化 。 


»2»5»x-3 

»»»print (type (5) 
«class 'int'» 
»»»x-'Hello world." 
»»» print (type (5) 


# 内 置 函 数 type() 用 来 返回 变量 类 型 
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<class 'str'> 

>>> [1,2,3] 

>>>print (type (x) ) 

<class 'list'> 

»»»isinstance 3, int) # 内 置 函数 isinstance() 用 来 测试 对 象 是 否 为 指定 类 型 的 实例 
True 

>>> isinstance("Hello world', str) 

True 


代码 中 首先 创建 了 整 型 变量 x, 然 后 又 分 别 创建 了 字符 串 和 列表 类 型 的 变量 x。 当 创 
建 了 字符 串 类 型 的 变量 x 之 后 ,之 前 创建 的 整 型 变量 x 自动 失效 ;创建 列表 对 象 x 之 后 ， 
之 前 创建 的 字符 串 变量 x 自动 失效 。 可 以 将 该 模型 理解 为 “状态 机 ”, 除 非 显 式 修改 变量 
类 型 或 删除 变量 ,否则 变量 将 一 直 保 持 之 前 的 类 型 。 

在 大 多 数 情况 下 ,如 果 变 量 出 现在 赋值 运算 符 或 复合 赋值 运算 符 (如 十 三 、* 一 等) 的 
左边 则 表示 创建 变量 或 修改 变量 的 值 , 否 则 表示 引用 该 变量 的 值 ,这 一 点 同样 适用 于 使 用 
下 标 来 访问 列表 、 字 典 等 可 变 序列 以 及 其 他 自 定义 对 象 中 元 素 的 情况 。 例 如 : 


»»»x-3 # 创 建 整 型 变量 
»»»print(e*2) # 访 问 变量 的 值 

9 

>>>x+=6 # 修 改变 量 的 值 
»»»print(x) # 读 取 变 量 值 并 输出 显示 
9 

>>> [1,2,3] # 创 建 列 表 对 象 
>>>print (x) 

[1, 2, 3] 

»»»x[lj-5 # 修 改 列表 元 素 值 
»»»print(x) # 输 出 显示 整个 列表 

[1 5, 3] 

»»»print(x[2]) # 输 出 显示 列表 指定 元 素 


3 


x 的 小 提示 : 在 Python 中 可 以 使 用 变量 表示 任意 大 的 数字 ,不 用 担心 范围 的 问题 ， 
但 是 对 于 浮 点 数 的 计算 由 于 精确 度 的 问题 偶尔 可 能 会 出 现 略 显 奇 苑 的 结果 。 例 如 ， 


>> > 9999 xx 99 # 这 里 *x 是 朝 乘 运算 符 

9901483535267234876022631247532826255705595288957910573243265291217948378940535 
1346442217682691643393258692438667776624403200162375682140043297505120882020498 
0098735552703841362304669970510691243800218202840374329378800694920309791954185 
1177984343295912121591062986999386699080675733747243312089424255448939109100732 


>>>0.3+ 0.2 # 实 数 相 加 


0.5 
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>>>0.3+0.3 
0.6 

»»»0.4-0.1 # 实 数 相 减 ,结果 稍微 有 点 偏差 
0.30000000000000004 

>>>0.4- 0.1==0.3 

False 

»»»0.9-0.5 

0.4 


另外 ,Python 内 置 支持 复数 运算 ,例如 : 


»»»x-3H4j HEH jR J 表示 复数 虚 部 
»»2»y-5t6j 

»»»xty # 复 数 之 间 的 加 \ 减 、 乘 、 除 
(8+ 10j) 

»»»x-y 

(2-23) 

Era €* y 

(- 9c 383) 

»»»x/y 

(0.6393442622950819* 0.03278688524590165j) 

>>> abs(x) # 复 数 的 模 

5.0 

>> >x.imag # 虚 部 

4.0 

>>>x.real # 实 部 

3.0 

»»»x.conjugate () HtA 

G-4j) 


QARAMA: Python 标准 库 fractions 中 的 Fraction 对 象 支持 分 数 运算 。 


>>> fram fractions import Fraction 

»»»x-Fraction(, 5) # 创 建 分 数 
»»»y-EFraction(3, 7) 

>>>x 

Fraction (3, 5) 

»»»x.nmerator # 分 子 

3 

»»»x.denaninator # 分 母 

5 

»»»xty # 分 数 之 间 的 四 则 运算 ,支持 通 分 
Eracticn (36, 35) 

»»»x*y 


Fraction(9, 35) 
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>>>x/ y 

Fraction (7, 5) 

>>>x-y 

Fraction (6, 35) 

>>>x *2 # 分 数 与 数字 之 间 的 运算 
Fraction(6, 5) 


字符 串 和 元 组 属于 不 可 变 序列 ,不 能 通过 下 标的 方式 来 修改 其 中 的 元 素 值 ,例如 : 


>>>x= (1,2,3) 
>>>print (x) 
(l, 2, 3) 
>>>x[1]=5 # 元 组 是 不 可 变 序列 ,不 支持 元 素 值 的 修改 
Traceback (most. recent. call last): 

File "«pyshellf7» ", line 1, in «module» 

x[1]-5 

TypeError: 'tuple' dbject does not support item assignment 


在 Python 中 ,允许 多 个 变量 指向 同一 个 值 ,例如 : 


»»»x-3 

»»»id(x) 

1786604560 

»»»y-x # 现 在 yA x 是 同一 个 对 象 
»»»id(y) # 所 以 内 存 地 址 是 一 样 的 
1786684560 


然而 ,继续 上 面 的 示例 代码 , 当 为 其 中 一 个 变量 修改 值 以 后 ,其 内 存 地 址 将 会 变化 ,但 
这 并 不 影响 男 一 个 变量 ,例如 : 

>>>x+=6 

»»»id() FER x 已 经 不 再 是 之 前 的 x 

1786684752 

>>>y 

3 


»»»id(y # 变 量 Y 的 地 址 和 值 都 没有 变 
1786684560 


在 这 段 代 码 中 ,内 路 函数 id() 用 来 返回 变量 所 指 值 的 内 存 地 址 。 可 以 看 出 ,在 
Python 中 修改 变量 值 的 操作 ,并 不 是 直接 修改 变量 的 值 ,而 是 修改 了 变量 指向 的 内 存 地 
址 (引用 )。 这 是 因为 Python 解释 器 首先 读 取 变 量 x 原来 的 值 ,然后 将 其 加 6, 并 将 结果 
存放 于 内 存 中 ,最 后 将 变量 x 指向 该 结果 的 内 存 空间 ,如 图 1-11 所 示 。 

Python 采用 的 是 基于 值 的 内 存 管理 方式 ,如 果 为 不 同 变量 赋值 为 相同 值 ,这 个 值 在 


内 存 中 只 有 一 份 , 多 个 变量 指向 同一 块 内 存 地 址 ,前 面 的 几 段 代码 也 说 明了 这 个 特点 。 再 
例如 : 


»»»tempst- [1, 1, 1] 
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Æ 1-11 Python 内 存 管理 模式 


>>> id(temiist[0])-— id (tempList [1])- — id (cempList[2]) # 内 存 地 址 一 样 
True 


当 一 个 变量 不 再 使 用 时 ,可 以 使 用 del 命令 将 其 删除 。Python 具有 自动 内 存 管理 功 
能 ,对 于 没有 任何 变量 指向 的 值 ,Python 自动 将 其 删除 。Python 会 跟踪 所 有 的 值 ,并 自 
动 删除 不 再 有 变量 指向 的 值 。 

最 后 ,在 定义 变量 名 的 时 候 , 需 要 注意 以 下 问题 。 

(1) 变量 名 必须 以 字母 (以 小 写字 母 居多 ,但 是 也 可 以 用 大 写字 母 ) 或 下 面 线 开头 ,但 
以 下 夯 线 开头 的 变量 在 Python 中 有 特殊 含义 ,参考 第 4 章 内 容 。 

(2) 变量 名 中 不 能 有 空格 或 标点 符号 (括号 .引号 .逗号 、 斜 线 . 反 斜 线 、 冒 号 、 句 号 \ 问 
号 等 ) 。 

(3) 不 能 使 用 关键 字 作为 变量 名 ,可 以 导入 keyword 模块 后 使 用 print(keyword 
. kwlist) 查 看 Python 的 所 有 关键 字 。 要 注意 的 是 , 随 着 Python 版 本 的 变化 ,关键 字 列表 
可 能 也 会 有 所 变化 。 

(4) 不 建议 使 用 系统 内 置 的 模块 名 .类 型 名 或 函数 名 以 及 已 导入 的 模块 名 及 其 成 员 
名 作为 变量 名 ,这 会 改变 其 类 型 和 含义 ,甚至 会 导致 其 他 代码 无 法 正常 执行 。 可 以 通过 
dir(_builtins _) 查 看 所 有 内 圈 对 象 名 称 。 

(5) 变量 名 对 英文 字母 的 大 小 写 敏感 ,例如 student 和 Student 是 不 同 的 变量 。 

LAMER: Python 变量 不 直接 存储 值 ,而 是 存储 对 象 的 引用 , 正 是 这 个 特点 使 得 
Python 变量 类 型 可 以 动态 改变 ,随时 可 以 指向 另 一 个 完全 不 同类 型 的 对 象 。 为 变量 赋值 
时 ,首先 在 内 存 中 寻找 一 块 合适 的 区 域 并 把 值 存 于 其 中 ,然后 把 这 个 内 存 地 址 赋值 给 
变量 。 

(QARAR: Python 字符 囊 对 象 提供 了 一 个 方法 isidentifier() 可 以 用 来 判断 指定 
字符 串 是 否 可 以 作为 变量 名 、 函 数 名 、 类 名 等 标识 符 。 例 如 : 


>>> 'abc'.isidentifier() #abc 可 以 作为 Python 变量 名 
True 

>>> '3abc'.isidentifier() # 变 量 名 不 能 以 数字 开头 
False 


>>>" 3abc'.isidentifier() 


True 


»»»'  3dx'.isidentifier() 


True 


»»»', Gdx'.isidentifier() 


False 


»»»'  Sdbc('.isidentifier() 


False 


>>> 'a,bc' .isidentifier() 


False 
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VJ Fi PR CBuilt-In Functions,BIF) 不 需要 导入 任何 模块 即 可 直接 使 用 ,执行 下 面 的 
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# 变 量 名 不 能 以 标点 符号 开头 


# 变 量 名 中 也 不 能 含有 标点 符号 


命令 可 以 列 出 所 有 内 置 函 数 和 内 置 对 象 : 


»»»dir( builtins ) 


可 以 使 用 help( 函 数 名 ) 可 以 查看 某 个 函数 的 用 法 ,不 需要 导入 模块 就 可 以 直接 使 用 
help( 模 块 名 ) 查 看 该 模块 的 帮助 文档 ,例如 help math). a6 FA AY P4 i eR CS Ho fie (ij 9 


说 明 如 表 1-3 Bros ,其 中 方 括号 内 的 参数 可 以 省 略 。 


表 1-3 Python 常用 内 置 函数 
功能 简要 说 明 


abs(x) 


返回 数字 x 的 绝对 值 或 复数 x 的 模 


allCiterable) 


如 果 对 于 可 迭代 对 象 iterable 中 所 有 元 素 x 都 有 bool GO Jy. True, W 
返回 True。 对 于 空 的 可 迭代 对 象 也 返回 True 


any(iterable) 


只 要 可 迭代 对 象 iterable 中 存在 元 素 x 使 得 bool(x) 为 True, 则 返回 
True。 对 于 空 的 可 迭代 对 象 ,返回 False 


bin(x) 把 数字 x 转换 为 二 进 制 串 
bool(x) 返回 与 x 等 价 的 布尔 值 True 或 False 
callableCobjec) 测试 对 象 object 是 否 可 调用 。 类 和 函数 是 可 调用 的 ,包含 _call __() 
方法 的 类 的 对 象 也 是 可 调用 的 

" 用 于 把 Python 代码 编译 成 可 被 exec O RR eval() 函 数 执行 的 代码 

compile) 
对 象 

chrCx) 返回 Unicode 编码 为 x 的 字符 
dirCobj) 返回 指定 对 象 obj 或 模块 obj 的 成 员 列表 


eval(s[, globals[, locals]]) 


计算 并 返回 字符 串 s 中 表达 式 的 值 


exec(x) 


执行 代码 或 代码 对 象 x 


filter(func, seq) 


返回 filter 对 象 ,其 中 包含 序列 seq 中 使 得 单 参数 函数 func 返回 值 为 
True 的 那些 元 素 ,如果 函数 func 为 None 则 返回 那些 值 等 价 于 True 
的 元 素 
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续 表 


功能 简要 说 明 


float(x) 


把 数字 或 字符 串 x 转换 为 浮 点 数 并 返回 


hasattr(obj, name) 


测试 对 象 obj 是 否 具有 成 员 name 


hash(x) 返回 对 象 x 的 哈 希 值 ,如 果 x 不 可 哈 希 则 抛 出 异常 

helpCobj) 返回 对 象 obj 的 帮助 信息 

hex(x) 把 数字 x 转换 为 十 六 进 制 串 

idCobj) 返回 对 象 obj 的 标识 (内 存 地 址 ) 

input([ 提 示 内 容 字 符 串 ]) 接收 键盘 输入 的 内 容 ,返回 字符 串 

mtl, dD) 返回 数字 x 的 整数 部 分 ,或 把 d 进 制 的 字符 串 x 转换 为 十 进 制 并 返 


回 ,d 默认 为 十 进 制 


isinstance ( object. class-or- 


type-or-tuple) 


测试 对 象 object 是 否 属于 指定 类 型 (如 果 有 多 个 类 型 的 话 需要 放 到 
元 组 中 ) 的 实例 


len(obj) 


返回 对 象 obj 包含 的 元 素 个 数 ,适用 于 列表 、 元 组 .集合 .字典 .字符 
RAR range 对 象 和 其 他 可 迁 代 类 型 的 对 象 


list ([x]), set ([x]) tuple 
(xD vdict([x]) 


把 对 象 x 转换 为 列表 、 集 合 、 元 组 或 字典 并 返回 ,或 生成 空 列表 ER 
合 、 空 元 组 、 空 字典 


map(func，seq) 


将 函数 func 映射 至 序列 seq 中 每 个 元 素 ,返回 包含 函数 值 的 map 
对 象 


max(x) ,min(x) 


返回 序列 x 中 的 最 大 值 . 最 小 值 , 要 求 序 列 x 中 的 所 有 元 素 之 间 可 比 
较 大 小 


next(x) 返回 可 迭代 对 象 x 中 的 下 一 个 元 素 
sum(x) 返回 序列 x 中 所 有 元 素 之 和 ,要 求 序 列 x 中 所 有 元 素 必须 为 数字 
oct(x) 把 数字 x 转换 为 八进制 串 


open(name[ ，mode]) 


以 指定 模式 mode 打开 文件 name 并 返回 文件 对 象 


ord(x) 


返回 1 个 字符 x 的 Unicode 编码 


pow(x, y) 


返回 x 的 y 次 方 ,等 价 于 xy 


print(value, ++, sep—'', end 
=\n', file— sys. stdout, flush 


— False) 


基本 输出 函数 


range([start,] end [，step]) 


返回 range 对 象 ,其 中 包含 [start,end) 区 间 内 以 step 为 步 长 的 整数 


reduce(func, seq) 


将 双 参 数 的 函数 func 以 和 迭代 的 方式 从 左 到 右 依次 应 用 至 序列 seq 
中 每 个 元 素 ,最终 返回 单个 值 作为 结果 。 在 Python 2. x 中 该 函数 为 
内 置 函数 ,在 Python 3. x 中 需要 从 functools 中 导入 reduce 函数 再 
使 用 


reversed(seq) 


返回 seq( 可 以 是 列表 ,元 组 ,字符 串 、range 以 及 其 他 可 迭代 对 象 ) 中 
所 有 元 素 逆 序 后 的 迁 代 器 对 象 


round(x [, 小 数位 数 ]) 


对 x 进行 四 全 五 人 , 若 不 指定 小 数位 数 , 则 返回 整数 
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ZR 


功能 简要 说 明 


strCobj) 


把 对 象 obj 直接 转换 为 字符 串 


sorted (iterable，key = None, 
reverse False) 


返回 排序 后 的 列表 ,其 中 iterable 表示 要 排序 的 序列 或 迭代 对 象 ,key 
用 来 指定 排序 规则 或 依据 ,reverse 用 来 指定 升序 或 降序 。 该 函数 不 
改变 iterable 内 任何 元 素 的 顺序 


typeCobj) 


返回 对 象 obj 的 类 型 


zip(seql [, seq2 […]]) 


返回 zip 对 象 , 其 中 元 素 为 (seql[ 让 ,seq2[ 襄 ，…) 形 式 的 元 组 


内 置 函 数 数量 众多 且 功 能 强大 ,很 难 一 下 子 全 部 解释 清楚 ,下 面 先 简单 介绍 其 中 几 
个 ,后 面 的 章节 中 将 根据 内 容 组 织 的 需要 逐步 展开 并 演示 更 多 函数 更 加 巧妙 的 用 法 。 

KONER: DT vL id RE t help() 查 看 某 个 函数 的 使 用 帮助 ; 加 编写 程序 时 
应 优先 考虑 使 用 内 置 函数 ,因为 内 置 函数 不 仅 成 熟 、 稳 定 ,而 且 速 度 相 对 较 快 ; 回 可 以 时 
入 sys 模块 后 使 用 print(sys. builtin_module_names) 查 看 Python 所 有 内 置 模块 名 称 ; 
图 可 以 使 用 help(modules) 查 看 本 机 所 有 可 用 模块 的 名 称 。 

Bg 拓展 阅读 : 除了 可 以 在 交互 模式 下 使 用 help() 函 数 直接 查看 某 个 对 象 的 使 用 帮 
助 , 例 如 help(id) 可 以 查看 内 置 函 数 id() 的 帮助 ,还 可 以 在 交互 模式 中 直接 执行 help() 函 
数 进 入 Python 的 内 置 帮助 系统 ,如 图 1-12 所 示 。 如 果 想 退出 这 个 帮助 系统 ,可 以 执行 


quit 命令 。 


RS 
>>> help(id) 


id(obj, /) 


>>> help() 


help> id 


id(obj, /) 


help> chr 


chr(i, /) 


help> 


LA "Python 3.5.1 Shell” TeJ 
File Edit Shell Debug Options Window Help 
E COPEN, CLEAN S UI IDEST TUTTEUTV oracror = 


Help on built-in function id in module builtins: 


Return the identity of an object. 


This is guaranteed to be unique among simultaneously existing objects. 
(CPython uses the object's memory address.) 


Welcome to Python 3.5's help utility! 


If this is your first time using Python, you should definitely check out 
the tutorial on the Internet at http://docs. python. org/3. S/tutorial/. 
Enter the name of any module, keyword, or topic to get help on writing 
Python programs and using Python modules. To quit this help utility and 
return to the interpreter, just type "quit". 

To get a list of available modules, keywords, symbols, or topics, type 
"modules, "keywords, "symbols, or "topics. Each module also comes 
with a one-line summary of what it does: to list the modules whose name 
or summary contain a given string such as "spam", type "modules spam". 


Help on built-in function id in module builtins: 
Return the identity of an object. 
This is guaranteed to be unique among simultaneously existing objects. 
(CPython uses the object's memory address.) 


Help on built-in function chr in module builtins: 


Return a Unicode string of one character with ordinal i; 0 <= i <= ÜxlOffff. 


图 1-12 Python 内 置 帮助 系统 
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VI E ERE binO ,octO ,int()、hex() 用 来 将 数字 转换 为 二 进 制 . 八 进 制 .十 进 制 和 十 
六 进 制 形式 。 
>>>bin(555) # 把 数字 转换 为 二 进 制 串 
"051000101011" 
»»»oct(555) # 转 换 为 八进制 串 
1001053" 
>>> hex(555) # 转 换 为 十 六 进 制 串 
,ozb， 
>>>int(，16) # 把 十 六 进 制 数 转换 为 十 进 制 数 
555 
>>> int (bin(54321)，2) # 二 进 制 与 十 进 制 之 间 的 转换 
54321 


ordO fI chr() 是 一 对 功能 相反 的 函数 ,ord() 用 来 返回 单个 字符 的 Unicode 码 , 而 
chr() 则 用 来 返回 Unicode 编码 对 应 的 字符 ,str() 则 直接 将 其 任意 类 型 参数 转换 为 字符 
串 。 下 面 的 代码 演示 了 这 几 个 函数 的 用 法 : 


>>>ord('a') # 查 看 指定 字符 的 Unicode 编码 
97 

>>>chr(65) 

"A 

»»»chr(ord('A')* 1) 

"B 

>>> chr (ord("3")+ 1) 

DU 

>>> chr (ord('H *)* 1) # 支 持 中文 

"WB 

>>>ord(' 董 ') # 这 个 用 法 仅 适用 于 Python 3.x 
33891 

>>>ord(' 付 ') 

20184 

>>>ord(' 国 ') 

22269 

>>> ''.join nap (chr, (33891, 20184, 22269))) 

' 董 付 国 ' 

>>> str(1234) # 直 接 变 成 字符 串 
1234， 

>>> str([12,3]) 

"0 2, 37 

>>> str((1,2,3)) 

"(1, 2, 3)' 

»»»str((1,2,3)) 

(1, 2,3) 
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maxO ,minO ,sum() 这 3 个 内 置 函 数 分 别 用 于 计算 列表 ,元 组 或 其 他 可 迭代 对 象 中 
所 有 元 素 最 大 值 、 最 小 值 以 及 所 有 元 素 之 和 ,sum() 只 支持 数值 型 元 素 的 序列 或 可 迭代 对 
象 ,max() 和 min() 则 要 求 序列 或 可 和 迭代 对 象 中 的 元 素 之 间 可 比较 大 小 。 例 如 下 面 的 示 
例 代码 ,首先 使 用 列表 推导 式 生成 包含 10 个 随机 数 的 列表 ,然后 分 别 计算 该 列表 的 最 大 
值 .最 小 值 和 所 有 元 素 之 和 。 列 表 推导 式 的 介绍 详 见 2.1. 3 节 。 


>>> fram randm import randint 
»»»a- [randint (1,100) for i in range(10)] # 包 含 10 个 [1,100] 之 间 随 机 数 的 列表 
>>>print trax(a), min(a), sum(a)) # 最 大 值 .最 小 值 .所 有 元 素 之 和 


很 显然 ,如 果 需 要 计算 该 列表 中 所 有 元 素 的 平均 值 ,可 以 直接 使 用 下 面 的 方法 : 
>>> sum(a) /len(a) 


器 1 小 技巧 : max( 〇 函数 还 有 个 key 参数 ,可 以 指定 比较 大 小 的 依据 ,例如 ,表达 式 
max(['2', '111], key 二 len) 的 值 为 111', 即 返回 长 度 最 大 的 字符 串 。 

对 于 初学 者 而 言 ,也 许 dir() 和 help() 这 两 个 内 置 函数 是 最 有 用 的 ,使 用 dir() 函 数 可 
以 查看 指定 模块 中 包含 的 所 有 成 员 或 者 指定 对 象 类 型 所 支持 的 操作 ,而 help O ROUE 
回 指定 模块 或 函数 的 说 明文 档 , 这 对 于 了 解 和 学 习 新 的 模块 与 知识 是 非常 重要 的 ,能 够 熟 
练 使 用 这 两 个 函数 也 是 学 习 能 力 的 重要 体现 。 例 如 ,下 面 的 代码 首先 导入 数学 模块 
math ,然后 查看 该 模块 的 常量 和 函数 ,并 查看 指定 函数 的 使 用 帮助 : 


>>> import math 
>>> dir (math) # 查 看 模块 中 可 用 对 象 
[' doc ',' lower ',' nme  ',' package  ',' spec  ', 'acos', 'acosh', 'asin', ' 
asinh', 'atan', 'atan2', 'atanh', 'oeil', 'oopysign', 'cos', 'cosh', 'degrees', 'e', 'erf', 'erfc', 'exp', ' 
exmml', 'fabs', 'factorial', 'floor', 'fuod', 'frexp', 'fam', 'gemma', 'hypot', 'isfinite', 'isinf', 'isnan', ' 
ldewp', "lgeme', 'log', 'loglO', 'loglp', "log?', 'modf', 'pi', 'pow', 'radians', 'sin', 'sinh', "apt, "ten', 
"tarh', 'trunc] 
»»»help(math.sqrt) # 查 看 指定 方法 的 使 用 帮助 
Help cn built- in function sqrt in module math: 
sgte) 
sqt (x) 
Return the square root of x. 
>>> help ath.sin) # 查 看 指定 方法 的 使 用 帮助 
Help on built- in function sin in module math: 
sint") 
sin(x) 
Return the sine of x(measured in radians). 
>>>dir(3 4j) # 查 看 复数 类 型 成 员 
[ abs ',' adi ',' class ',' coerce ',' delatr '__div - 


.diwod "',' doc "',' eq ',' flot  ',' floordiv ',' fomat ',' ge 
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^ gue Cot pow 7," mi "Q* o niy "e" Cxdhmpd "~" mie CLt 3 
' rer ',' rfloxrdiv ',' mod ',' mul ',' pw ',' rsib 


','  setattr ','  sizeof "',"' str _ |" Sub ','  subclasshook  ', 


conjugite', 'img', 'real'] 


»»»dir('') # 查 看 字符 串 类 型 成 员 


[' adi ',' class ',' omtains ",' delattr ',' doc ',"' eq ',"' fomet ', 
' ge ',' getattribute ','  getitem ','  getnewargs ','  getslice ',"' gt '," — 


Ep.Ocp^- de TQU' den n SE SO app Coto gmub 7Q" qe CU o mewé 
(07, ' redee ex C2! repr 7CQ' md ml setattr C _ 
sizeof ',' str  ', ' subclasshook _', ' fommtter field nme split', ' fomatter parser', 
'capitalize', 'center', 'oount', 'decode', 'enoode', 'endswith', 'expandtabs', 'find', 'fomat', "index 
split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', "translate', ‘upper', 'zfill'] 


AMER: 在 Python 中 带 有 下 画 线 的 成 员 有 特殊 含义 , 详 见 本 书 第 4 章 。 
内 置 函 数 type() 和 isinstance() 可 以 用 来 判断 数据 类 型 ,常用 来 对 函数 参数 进行 检 


查 , 可 以 避免 错误 的 参数 类 型 导致 函数 崩 浊 或 返回 意料 之 外 的 结果 。 不 过 ,从 另 一 方面 来 
讲 , 过 多 地 使 用 type() 和 isinstance() 函 数 会 一 定 程度 上 影响 多 态 ,建议 谨慎 使 用 。 


>>>type(3) # 查 看 3 的 类 型 

«class 'int'> 

>>>type([3]) # 查 看 [3] 的 类 型 

«class 'list'> 

>>> type({3})in(list, tuple, dict) # 判 断 (3) 是否 为 list、tuple 或 dict 
False 

>>> type ({3)in(list, tuple, dict, set) # 判 断 {3} 是 否 为 list、tuple、dict 或 set 
Tre 

»»»isinstance(3, int) 

Tre 

»»»isinstance(3j, int) 

False 

»»»isinstance(3j, (int, float, omplex)) # 判 断 3 是 否 为 int. float EX complex 370 f 3c [fi] 
Tre 


QARAR: Python 之 祥 。( 道 德 经 ) 云 : AGREE GRE ikh., A 


道 创 始 人 、 武 术 大 家 李小龙 也 说 过 “武术 的 非凡 之 处 在 于 它 的 简单 ”。 禅 不 是 一 种 学 说 或 
者 理论 ,而 是 一 种 境界 ,是 一 种 简 简单 单 的 自然 。 禅 不 是 用 来 专门 修 的 ,功夫 到 了 ,代码 写 
好 了 , 禅 自然 就 有 了 。 下 面 的 “Python 之 禅 不 用 去 翻译 ,更 不 要 试图 从 这 段 话 里 学 到 什 
么 实质 性 的 技术 和 知识 ,只 需要 用 心 体会 并 在 编写 代码 时 多 想 想 这 几 句 话 ,每 写 完 一 段 代 
码 之 后 要 反复 阅读 ,检查 是 否 符合 Python 之 禅 。 


>>> import this 
The Zen of Python, by Tim Peters 
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Beautiful is better than ugly. 
Explicit is better than implicit. 

Simple is better than complex. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

Special cases aren't special enough to break the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one— and preferably only one— dbvious way to do it. 
Although that way may not be dbvious at first unless you're Dutch. 
Now is better than never. 

Although never is often better than * right* now. 

If the implementation is hard to explain, it's a bad idea. 

If the implementation is easy to explain, it may be a good idea. 
Namespaces are one honking great idea— let's do more of those! 


133 运算 符 与 表达 式 
Python 是 纯 面向 对 象 的 编程 语言 ,在 Python 中 一 切 都 是 对 象 。 而 熟悉 面向 对 象 编 


程 的 读者 应 该 知道 ,对 象 由 数据 和 行为 两 部 分 组 成 ,而 行为 主要 通过 方法 来 实现 ,通过 一 
些 特殊 方法 的 重 写 ,可 以 实现 运算 符 重 载 。 从 这 个 角度 来 讲 , 运 算 符 也 是 表现 对 象 行为 的 
一 种 形式 ,不 同类 的 对 象 支持 的 运算 符 会 有 区 别 ,而 同一 种 运算 符 作 用 于 不 同 的 对 象 时 也 
可 能 会 表现 出 不 同 的 行为 和 结果 。 

除了 算术 运算 符 、 关 系 运算 符 、. 逻辑 运 算 符 以 及 位 运算 符 等 常见 运算 符 之 外 ,Python 
还 支持 一 些 特 有 的 运算 符 ,例如 成 员 测试 运算 符 、 集 合 运算 符 、 同 一 性 测试 运算 符 等 。 使 
用 时 需 注意 ,Python 很 多 运算 符 具有 多 种 不 同 的 含义 ,作用 于 不 同 操作 数 的 含义 并 不 相 
同 ,非常 灵活 。 常 用 的 Python 运算 符 如 表 1-4 所 示 , 优 先 级 遵循 的 规则 为 : 算术 运算 符 
优先 级 最 高 ,其 次 是 位 运算 符 / 集 合 运 算 符 .关系 运 算 符 、 逻 辑 运算 符 , 算 术 运 算 符 之 间 遵 
循 “ 先 乘除 ,后 加 减 ? 的 基本 运算 原则 。 虽 然 Python 运算 符 有 一 套 严 格 的 优先 级 规则 ,但 
是 强烈 建议 在 编写 复杂 的 表达 式 时 尽量 使 用 圆 括号 来 明确 说 明 其 中 的 逻辑 来 提高 代码 可 


表 1-4 Python 运算 符 
运算 符 示例 功能 说 明 
xty 算术 加 法 ,列表 、 元 组 ,字符 串 合 并 
x—y 算术 减法 ,集合 差 集 
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x*y 乘法 ,序列 重复 
x/y 真 除法 
x//y 求 整 商 
—x 相反 数 
xy 求 余数 ,字符 串 格式 化 
x**y FAA 
x<y;x<=y;x>y; x> =y 大 小 比较 ,集合 的 包含 关系 比较 
x 一 一 yix! 一 y 相等 ( 值 ) 比 较 ,不 等 ( 值 ) 比 较 
xory 逻辑 或 (只 有 x 为 假 才 会 计算 y) 
x and y 逻辑 与 (只 有 x 为 真 才 会 计算 y) 
not x 逻辑 非 
xin y;x not in y 成 员 测试 运算 符 
xis ysx is not y 对 象 实体 同一 性 测试 (地 址 
|^ E VR 位 运算 符 
Bl 集合 交集 .并 集 、 对 称 差 集 
@ 和 矩阵 相 乘 运算 符 

+ 运算 从 除了 用 于 算术 加 法 ,还 可 以 用 于 列表 ,元 组 和 字符 串 的 合并 或 连接 ,生成 新 

对 象 ,例如 ， 

>>>3+ (3 4j) # 整 数 和 复数 相 加 

(6+ 43) 

>>> [ 2, 3+ (4, 5, 6] # 连 接 两 个 列表 

[1, 2, 3, 4, 5, 6] 

>>> (l, 2, 3* (4) # 连 接 两 个 元 组 

(L 2, 3, 4) 

>>> 'abod'* '1234' # 连 接 两 个 字符 串 

'abod1234' 

下 面 的 代码 演示 了 集合 运算 符 的 用 法 : 

>>> {1, 2, 3, 4, 5)- {3} # 差 集 

{1, 2, 4, 5) 

»»»2(0,2,3,4,5)| (6) # 并 集 

和 名 等 

»»»(,2,3, 4, 5} & (3 # 交 集 

13} 

»»»0,2,3,4,5, 6) ^ (5, 6, 7, 8) # 对 称 差 集 


1,2, 3,4, 7, 8} 
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* 运算 符 除了 表示 算术 乘法 ,还 可 用 于 序列 与 整数 的 乘法 ,表示 序列 元 素 的 重复 , 生 


>>>[ 2, 3] * 3 

[L 2, 3, 1, 2, 3, 1, 2, 3] 
»»»(,2,3* 3 

(5. 2,3,1,2,3, 3, 2, 3) 
»»»'ab'* 3 
dl 


由 于 Python 列表 中 存储 的 是 地 址 而 不 是 元 素 值 , 当 包含 子 列表 的 列表 进行 元 来 重复 
的 时 候 , 情 况 会 复杂 一 些 ,例如 : 


»»»x-[[1] * 3 

>>>x 

[[1], [1], 1] 
»»»id(x[0])-—id(x[1])-— id(x[2]) 
True 

»»»Xx[0].append(3) 

>>>x 

[t 3], D, 3], [1, 3]] 
>>>iqd(x[0])==id(x[1])==id(x[2]) 
True 


运算 符 / 和 // 在 Python 中 分 别 表示 算术 除法 和 算术 求 整 商 ,例如 : 


>>>3/2 
1.5 
>>>15//4 
3 


AMER: /运算 符 在 Python 3. x 中 表示 真 除法 ,而 在 Python 2. x 中 含义 略 有 不 
同 , 其 运算 规则 为 “整数 相 除 的 结果 还 是 整数 ,实数 与 整数 相 除 的 结果 是 实数 ”"。 学 过 C 
语言 的 读者 估计 会 对 这 样 的 运算 规则 感到 亲切 ,但 请 记 住 这 仅 限 于 Python 2. x。 也 就 是 
说 ,avg 一 sum(lst) * 1.0 / len(lst) 这 样 的 写法 在 Python 3. x 中 就 没 必要 了 ,直接 写 avg 
—sum(lst)/ len(ls 35 3T XA T , 

% 运 算 符 可 以 用 于 整数 或 实数 的 求 余数 ,还 可 以 用 于 字符 串 格 式 化 ,例如 : 


>>> 123.45 $3.2 
1.849999999999996 
>>>789 %23 

7 

>>> '%c, %d'% (65, 65) 
"A, 65" 


Python 关系 运算 符 最 大 的 特点 是 可 以 连用 ,并 且 其 含义 与 我 们 日 常 的 理解 完全 一 
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8. 


一 个 


例如 : 


当然 使 用 关系 运算 符 的 一 个 最 重要 的 前 提 是 ,操作 数 之 间 必 须 可 比较 大 小 。 例 如 ,把 
字符 串 和 一 个 数字 进行 大 小 比较 是 毫 无 意义 的 ,所 以 Python 也 不 支持 这 样 的 运算 。 
>>>1l<3<5 # 等 价 于 Kk3and x5 

True 

>>>x 52 

True 

>>>D&8 

False 

>>> 'Hello'> 'world' # 比 较 字 符 串 大 小 

False 

>>> [1, 2, 3<[ 2, 4] # 比 较 列表 大 小 

True 

>>> 'Hello'>3 # 字 符 串 和 数字 不 能 比较 


Traceback (most. recent. call last): 
File "«pyshellf4» ", line 1, in «module» 
'Hello'> 3 
TypeError: unorderable types: str ()> int () 


成 员 测试 运算 符 in 用 于 成 员 测试 , 即 测试 一 个 对 象 是 否 是 另 一 个 对 象 的 成 员 ,例如 


>>>3in [1, 2, 3] HUR 3 是 否 为 列表 n, 2, 3] 的 成 员 
True 
>>>5 in range(l 10, 1) #range() 是 用 来 生成 指定 范围 数字 的 内 置 函数 


>>> 'abc' in 'abodefg' 

True 

>>>for i in(3, 5, 7): # 循 环 ,成 员 遍 历 
print(i, end Nt!) 

Jos F 


位 运算 符 只 能 用 于 整数 ,内 部 执行 过 程 是 : 首先 将 整数 转换 为 二 进 制 数 ,然后 右 对 


齐 , 必 要 的 时 候 左 侧 补 0, 按 位 进行 运算 ,最 后 再 把 计算 结果 转换 为 十 进 制 数字 返回 。 位 


运算 


符 用 法 如 下 面 的 代码 所 示 : 


»»»3««2 Hg 3 左 移 2 位 
12 

>>>3&7 # 位 与 运算 

3 

>>>318 # 位 或 运算 

11 

>>>416 

6 

»52»3^5 # 位 异 或 运算 
6 
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(QARAR: 位 运算 规则 为 1&1=1、18&0=0&1=0&0=0,1|1=110=011=1.0| 
0—0,1^1—0^0—0,1^0—0^1 — 1, 4 4542 BE s MERE 0, 右 移 位 时 左 侧 补 0。 

Python 3. 5 增加 了 一 个 新 的 矩阵 相 乘 运算 符 @, 下 面 的 代码 演示 了 该 运算 符 的 
用 法 : 


>>> import numpy #numpy 是 用 于 科学 计算 的 Python 扩展 库 
»»»x-nupy.ones (3) #cnes(0 函 数 用 于 生成 全 1 矩阵 ,参数 表示 和 矩阵 大 小 
»»»m-nmpy.eye(3) * 3 #eye() 函 数 用 于 生成 单位 矩阵 

»»»m[0,2]-5 # 设 置 矩阵 指定 位 置 上 元 素 的 值 
>>>m[2, 0] =3 

>>>x@m SB PERI 


array([6., 3., 8.]) 


在 Python 中 ,单个 任何 类 型 的 对 象 或 常数 属于 合法 表达 式 ,使 用 表 1-4 中 运算 符 连 
接 的 变量 和 常量 以 及 函数 调用 的 任意 组 合 也 属于 合法 的 表达 式 。 

(以 拓展 知识 : 复合 赋值 运算 符 。 除 了 表 1-4 中 列 出 的 运算 符 ,Python 还 支持 类 似 于 
+ 、/ 二 、* = 二、 也 二 、| 二 等 复合 赋值 运算 符 ,表示 在 自身 的 基础 上 进行 运算 。 例 
de. "m" xd —3 等 价 于 x 一 x 十 3, 其 他 复合 赋值 运算 符 的 功能 类 似 。 
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所 谓 对 话 ,最 简单 的 形式 就 是 你 问 我 答 ,或 者 我 问 你 答 。 而 人 机 对 话 或 人 机 交互 最 基 
本 的 功能 应 该 是 机 器 能 够 接收 用 户 的 输入 ,并且 能 够 把 处 理 结果 通过 一 定 的 形式 展示 给 
用 户 。 在 Python 中 ,内 置 冰 数 input() 用 来 接收 用 户 输入 ,print() 则 用 于 把 处 理 结 果 或 
其 他 信息 展示 给 用 户 。 对 于 input() 而 言 , 不 论 用 户 输入 什么 内 容 ,一 律 作为 字符 串 对 待 ， 


必要 的 时 候 可 以 使 用 内 置 函 数 eval() 对 用 户 输入 的 内 容 进行 类 型 转换 。 例 如 : 


»»»x-input('Please input: ') 

Please input: 345 

>>>x 

1345" 

>>> type(x) # 把 用 户 的 输入 作为 字符 串 对 待 
«class 'str'» 

>>> int (x) 

345 

»»»eval(x) # 对 字符 串 求 值 
345 

»»»x-input('Please input: ') 

Please input: [1, 2, 3] 

>>>x 

"E, 2, 37 

>>> typ) 

<class 'str'» 
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»»»eval(x) 
[1, 2, 3] 

»»»x-inut('Please input:') # 不 论 用 户 输入 什么 ,都 作为 一 个 字符 串 来 对 待 
Please input:'hello world' 

>>>x # 如 果 本 来 就 想 输 入 字符 串 ,就 不 用 再 输入 引号 了 
mhello world'" 

>>>eval (x) 

"hello world' 


内 置 函数 print() 用 于 输出 特定 信息 ,语法 格式 为 


print (valu, ***, sep- ' ', end- "An', file sys.stdout, flush- False) 


其 中 ,sep 参数 之 前 为 需要 输出 的 内 容 ( 可 以 有 多 个 ) ;sep 参数 用 于 指定 数据 之 间 的 分 隔 
f ,默认 为 空格 ;file 参数 用 于 指定 输出 位 置 ,默认 为 标准 控制 台 ,也 可 以 重 定向 输出 到 文 
件 。 例 如 : 


»»»print(l, 3, 5, 7, sep- '\t') # 修 改 默认 分 隔 符 

i 3 9 TY 

»»»foriinrange(10): # 修 改 默认 行 尾 结束 符 , 不 换行 
print (i, end- ') 


0123456789 
>>> fp= qpen('D:\\test.txt', 'at ') 

»»»print ('Hello world!', file= fp) # 重 定向 ,将 内 容 输出 到 文件 中 
>>> 印 .close() 


a IRR ERA Python 3. 5. 1 进行 讲解 和 演示 。 在 Python 2. x 中 内 置 输 


入 函数 input() 和 输出 语句 print 的 用 法 与 Python 3.x 不 同 , 非 常 喜 欢 Python 2. x 的 读 
者 可 以 查阅 官方 帮助 文档 ,或 阅读 我 的 另 一 本 书 《Python 程序 设计 》( 清 华 大 学 出 版 社 
2015 年 8 月 第 一 版 )。 


(以 拓展 知识 : Python 标准 库 sys 还 提供 了 read() 和 readline() 方 法 用 来 从 键盘 接 


收 指定 数量 的 字符 。 例 如 : 


>>> inport sys 

>>>x=sys.stdin. read (5) # 读 取 5 个 字符 ,如 果 输 入 不 足 5 个 ,等 待 继续 输入 
asd 

s 

>>>x 

€— 

»»» x- sys.stdin.read(5) # 读 取 5 个 字符 ,如 果 超 出 5 个 ,截断 
abodefghijklmop 

>>>x 

Woki 

>>>:=sys.stdin.read (5) # 从 缓冲 区 内 继续 读 取 5 个 字符 


>>>x 
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"fghij" 
»»»x- sys.stdin.read(5) 

>>>X 

"Kino! 

2» x-sys.stdin.read(5) # 缓 冲 区 内 不 足 5 个 字符 ,就 等 待 用 户 继续 输入 
1234 

2»»XxX 

"PNnl23" 

»»»x- sys.stdin.readline () # 从 缓冲 区 内 读 取 字 符 , 遇 到 换行 符 就 结束 
2»2»5X 

"An" 

>>> x-sys.stdin.readline () 

abod 

>>>x 

"abcdNn' 

»»» x7 sys.stdin.readline (13) # 如 果 缓 冲 区 内 容 比 需要 的 少 ,就 遇 到 换行 符 结束 
abodefq 

>>>x 

'abodefg\n' 

»»» x- sys.stdin.readline (13) # 如 果 缓 冲 区 内 容 比 需要 的 多 ,就 截断 
abodefghi jkImoparst. 

>>>x 

'abodefghijklm' 

>>>z sys.stdin.readline (13) # 从 缓冲 区 继续 读 取 

2»»X 


"noparst n! 
'O 拓展 知识 : Python 标准 库 pprint 还 提供 了 更 加 友好 的 输出 函数 (pretty printer) 


pprint() ,可 以 更 好 地 控制 给 出 格式 ,如 果 要 输出 的 内 容 多 于 一 行 则 会 自动 添加 换行 和 缩 
进来 更 好 地 展示 内 容 的 结构 。 例 如 : 


>>> import pprint 
>>>t= [[[['black', 'cyan'], 'white', ['green', 'red']], [['magenta', 'yellow'], 'blue']]] 
»»»pprint.porint (t) # 默 认 width= 80 


[[[['black', 'cyan'], white', ['green', 'red']], 
[['magenta', 'yellow'], ‘blue']]] 
»»»pprint.pprint (t, width= 50) 
[[[["black', 'cyan'], 'white', ['green', 'red']], 
[['magenta', 'yellow'], 'blue']]] 
»»»pprint.pprint (t, width= 30) # 根 据 需要 进行 换行 和 缩 进 
[[[['black', 'cyan'], 
"white', 
[l'green', 'red']], 
[['magenta', 'yellow'], 
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‘blue"]]] 
1.4 模块 安装 与 使 用 
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Python 之 所 以 得 到 各 行业 领域 工程 师 、 策 划 师 以 及 管理 人 员 的 青睐 ,与 涉及 各 行业 
各 领域 开发 的 扩展 库 也 有 很 大 关系 ,不 仅 数量 众多 、 功 能 强大 ,关键 是 用 起 来 很 方便 。 虽 
然 Python 标准 库 已 经 拥有 了 非常 强大 的 功能 ,但 很 多 时 候 如 果 我 们 能 够 熟练 运用 扩展 
库 , 会 大 幅度 提高 软件 开发 速度 。 

可 以 把 Python 模块 看 作 一 个 个 用 来 存放 积木 的 收纳 箱 ,每 个 收纳 箱 里 放 着 很 多 特 
定 类 型 的 积木 (函数 或 类 ) ,用 的 时 候 我 们 把 收纳 箱 从 仓库 里 拖 出 来 然后 打开 它 ,选择 合适 
的 积木 来 搭建 自己 的 房子 汽车、 轮船 .飞机 等 作品 (程序 ) 就 可 以 了 。 

当前 ,pip 已 经 成 为 管理 Python 扩展 库 ( 或 模块 ,一 般 不 做 区 分 ) 的 主流 方式 ,使 用 
pip 不 仅 可 以 实时 查看 本 机 已 安装 的 Python 扩展 库 列表 ,还 支持 Python 扩展 库 的 安装 、 
升级 和 印 载 等 操作 。 使 用 pip 工具 管理 Python 扩展 库 只 需要 在 保证 计算 机 联网 的 情况 
下 输入 几 个 命令 即 可 完成 , 极 大 方便 了 用 户 。 常 用 pip 命令 的 使 用 方法 如 表 1-5 所 示 。 


表 1-5 常用 pip 命令 使 用 方法 


pip 命令 示例 说 HH 
pip install SomePackage 安装 SomePackage 模块 
pip list 列 出 当前 已 安装 的 所 有 模块 
pip install —upgrade SomePackage 升级 SomePackage 模块 
pip uninstall SomePackage i SomePackage 模块 


在 https: //pypi. python. org/pypi 中 可 以 获得 一 个 Python 扩展 库 的 综合 列表 ,本 书 
编写 完成 时 ,该 网 站 已 经 收纳 了 88 348 个 涉及 各 领域 的 扩展 库 , 并 且 每 天 都 以 几 十 个 的 
速度 在 增加 。 有 些 扩展 库 安 装 时 要 求 本 机 已 安装 相应 版 本 的 C++ 编译 器 ,或 者 有 些 扩展 
库 暂 时 还 没有 与 本 机 Python 版 本 对 应 的 官方 版 本 ,这 时 可 以 从 http://www. lfd. uci. 
edu/ — gohlke/pythonlibs/ F £4 Wr ff] whl 文件 ,然后 在 命令 提示 符 环境 中 使 用 pip 命令 
进行 安装 ,例如 : 


pip install pygame- 1.9.220- cp35- none- win_amd64.whl 


POED: 使 用 pip 命令 安装 Python 扩展 库 需 要 在 命令 提示 符 环境 中 进行 ,并 且 
需要 切换 至 pip 命令 所 在 目录 ,这 个 步骤 很 多 人 并 不 熟悉 。 可 以 在 “资源 管理 器 ?或 “计算 
机 ”中 通过 单 击 进入 Python 安装 文件 夹 中 的 scripts 文件 卖 ,然后 按 住 Shift 键 再 右 击 空 
白 处 ,选择 “在 此 处 打开 命令 窗口 "直接 进入 命令 提示 符 环境 ( 见 图 1-13), 然 后 即 可 使 用 
pip 命令 管理 Python 扩展 库 。 然 而 ,有 些 读者 根本 不 知道 Python 安装 到 什么 地 方 了 ( 尤 
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其 是 学 校 某 些 机 房 采 用 默认 安装 模式 时 会 出 现 这 种 情况 ), 此 时 可 以 从 “开始 ”菜单 依次 展 
开 到 Python 启动 程序 的 快捷 方式 ,然后 右 击 并 选择 “属性 ”, 在 “属性 ”窗口 中 选择 “打开 
文件 位 置 "按钮 就 可 以 直接 进入 Python 安装 文件 夹 , 如 图 1-14 和 图 1-15 所 示 。 


» WIN7 (C) » Python 3.5 » Scripts » 
IAM wm 
共享 ” SO 


名 称 修改 日 期 m 

Ji ..pycache... 2016-5-7 15:20 — xx 
de crawler 2016-4-30 16:58 xx 
di first django 2016-5-7 16:22 XH 
Ji images2gif-1.0.1 2016-5-1 14:25 文件 去 
Ji Isprime 2016-5-7 17:23 文件 夫 
di ssdeep-3.1.1 2016-6-9 11:13 xx 
FP build exe.exe 2015-117 11:37 — 应 用 程序 


[3] createfontdatachunk.py. 2015-117 11:32 — PY 文件 
f? cygdb.exe 2015-117 1047 — 应 用 程序 
也 cython.exe 015-11-7 10:4 应 用 程序 
fe. onhonizeexe 应 用 程序 
f? django-adminexe 应 用 程序 
@ django-adminpy PY 文件 
FP. easy installexe. 应 用 程序 
FP easy install-3.5.exe 应 用 程序 
[E enhancer.py PY 文件 
[3] explode.py PY 文件 
国人 pypy PY 文件 
[DD garden 文件 
garden.bat Windows RAHE... 
[P] gifmaker.py PY 文件 


图 1-13 从 Python 安装 文件 夹 的 scripts 文件 夹 进入 命令 提示 符 环境 


ummon [ma | 
Ji PyQt GPL v5.5.1 for Python v| B EnaA. 


SB 汪 ho 到 “pythonw.rar"m) 
Ji Python 27 
Ji Python 34 B ERR E-mail.. 
B ER "pythonw.rar" 并 E-mail 


TP IDLE (Python 3.5 64-bit) CERESE 
-bi 附 到 [开始 ] eU) 


图 1-14 展开 Python 启动 程序 并 右 击 后 选择 “属性 ” 


(QARAR: Python 支持 创建 多 个 虚拟 环境 ,每 个 虚拟 环境 都 是 包含 Python 和 相 
应 扩展 库 的 一 个 目录 ,多 个 虚拟 环境 (文件 夹 ) 之 间 互 相 不 干扰 。 如 果 有 可 能 根据 需要 使 
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e IDLE (Python 3.5 64-bit) El 


xm | 快捷 方式 penes [im | 以 前 的 版 本 
gò IDLE (Python 3.5 64-bit) 


目标 类 型 。 应 用 程序 
目标 位 置 : 。 Python 3.5 
Bio e” "C MPython 3.5\Lib\idlelib\idle. pyw” 


起 始 位 置 5): “C:\Python 3.5\" 


RRO: X 
TARN: [AED — —X 
EO Launches IDLE, the int 5 


CIRXHREOD ) (ghe CO...) [ SRD... 


VT 


[mik] ( mmo 
图 1-15 选择 “打开 文件 位 置 "按钮 进入 Python 安装 文件 夹 


用 不 同 版 本 的 扩展 库 , 这 就 需要 使 用 Python 提供 的 虚拟 环境 了 。 下 面 我 们 通过 一 个 实 
际 的 例子 来 演示 如 何 创建 和 使 用 Python 虚拟 环境 ,首先 进入 命令 提示 符 环境 并 切换 至 
Python 安装 目录 的 tools\Scripts 文件 夹 , 然 后 执行 下 面 的 命令 : 


..\..\Python pyvenv.py ..\..\Python docx 


然后 稍 等 片刻 , 当 再 次 出 现 命令 提示 符 时 就 表明 Python 虚拟 环境 创建 成 功 了 , 接 下 来 使 
用 cd 命令 切换 至 Python 安装 目录 的 Python_docx\ Scripts 文件 夹 中 ,执行 activate 命 
令 , 成 功 的 话 会 发 现 前 面 的 提示 符 有 些 变化 ,这 时 就 可 以 使 用 pip 工具 来 安装 需要 使 用 的 
扩展 库 了 ,安装 完成 后 输入 并 执行 python 命令 ,就 可 以 进入 Python 开发 环境 并 使 用 已 安 
装 的 扩展 库 了 。 
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中 有 i 可 扩展 性 ， iid S ck ENDE RD IR IG 最 小 权限 ” Kant 思想 是 一 
致 的 ,有 助 于 提高 系统 安全 性 。 可 以 使 用 sys. modules. items() 显 示 所 有 预 加 载 模块 的 相 
关 信息 。 

内 置 对 象 可 以 直接 使 用 ,而 标准 库 和 扩展 库 需 要 导入 之 后 才能 使 用 其 中 的 对 象 , 当 
然 ,扩展 库 还 需要 先 正 确 安装 才能 导入 。Python 中 导入 模块 的 方法 主要 有 两 个 。 

* import 模块 名 [as 别名 ] 

使 用 这 种 方式 导入 以 后 ,使 用 时 需要 在 对 象 之 前 加 上 模块 名 作为 前 级 ,也 就 是 必须 以 
“模块 名 . 对 象 名 ”的 方式 进行 访问 。 也 可 以 为 导入 的 模块 设置 一 个 别名 (或 者 外 号 ) ,然后 
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就 可 以 使 用 * 别 名. 对象 名 ”的 方式 来 使 用 其 中 的 对 象 了 。 


>>> inport math 

»»»math.sin(0.5) # 求 0.5 人 单位 是 弧度 ) 的 正弦 值 
0.479425538604203 

>>> import randm 


>> >x= random. random () # 获 得 [0.1) 内 的 随机 小 数 

>>> r= randm.randint (1, 100) # 获 得 [1,100] 区 间 上 的 随机 整数 
>>> import numpy as mp # 导 入 模块 并 设置 别名 
»»»a-n.array((1,2,3,4)) # 通 过 模块 的 别名 来 访问 其 中 的 对 象 
>>>Print(a) 


[1234] 


* from 模块 名 import 对 象 名 [ as 别名 ] 

使 用 这 种 方式 仅 导入 明确 指定 的 对 象 , 并 且 可 以 为 导入 的 对 象 起 一 个 别名 。 这 种 导 
人 方式 可 以 减少 查询 次 数 ,提高 访问 速度 ,同时 也 减少 了 程序 员 需 要 输入 的 代码 量 , 而 不 
需要 使 用 模块 名 作为 前 级 。 例 如 : 


> > > fram math import sin # 只 导入 模块 中 的 指定 对 象 
»»»sinG) 

0.1411200080598672 

> > > fram math import sin as f # 给 导入 的 对 象 起 个 别名 
>>>f(G) 


0.141120008059867 
比较 极端 的 情况 是 一 次 导入 模块 中 的 所 有 对 象 ,例如 : 


>>> frm mth import * 


>>> sin(3) # 求 正弦 值 
0.1411200080598672 
>>>gcd(36, 18) # 求 最 大 公约 数 


18 
这 种 方式 简单 粗暴 ,虽然 写 起 来 比较 省 事 , 可 以 直接 使 用 模块 中 的 所 有 函数 和 对 象 而 
不 需要 再 使 用 模块 名 作为 前 缀 ,但 一 般 并 不 推荐 使 用 。 如 果 多 个 模块 中 有 同名 的 对 象 ,这 
种 方式 将 会 导致 具有 最 后 一 个 导入 的 模块 中 的 同名 对 象 是 有 效 的 ,而 之 前 导入 的 模块 中 
该 对 象 无 法 访问 。 例 如 ,a. py 文件 中 内 容 如 下 : 
def test(): 
print('test in a.py") 
b. py 文件 中 的 内 容 如 下 : 
def test): 
print('test in b.py') 


那么 导入 a 模块 以 后 ,test() 方 法 是 可 用 的 ,而 导入 b 模块 之 后 a 模块 中 的 test() 方 
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法 就 无 法 使 用 了 。 例 如 : 


>>> fram a inport * 

>>>test() 

test in a.py 

>>> framb inport * # 这 会 导致 a 模块 中 的 test() 方 法 无 法 使 用 
>>>test() 

test in b.py 


(QARINA: 重新 导入 模块 。 在 自己 编写 模块 时 ,可 能 需要 反复 修改 代码 然后 重新 
导入 模块 进行 测试 ,此 时 可 以 使 用 imp 模块 或 importlib 模块 的 reload() 函 数 ,重新 加 载 
模块 时 要 求 该 模块 已 经 被 正确 加 载 。 也 就 是 说 ,第 一 次 导入 和 加 载 模块 时 不 能 使 用 
reload() 方 法 。 另 外 ,在 Python 2.x 中 reload() 是 内 置 函 数 , 可 以 直接 使 用 。 

PUMA: 使 用 from…import… 的 方式 明确 导入 指定 的 对 象 而 不 导入 整个 模块 ， 
可 以 适当 提高 程序 加 载 和 运行 速度 。 

COURIR AIR: 导入 模块 时 文件 搜索 的 顺序 。 在 导入 模块 时 ,Python 首先 在 当前 目 
录 中 查找 需要 导入 的 模块 文件 ,如 果 没 有 找到 则 从 sys 模块 的 path 变量 所 指定 的 目录 中 
查找 ,如 果 仍 没有 找到 模块 文件 则 抛 出 异常 提示 模块 不 存在 。 可 以 查看 sys 模块 中 path 
变量 的 值 来 获知 Python 导入 模块 时 搜索 模块 的 路 径 , 也 可 以 使 用 append() 方 法 向 其 中 
添加 自 定义 的 文件 夹 以 扩展 搜索 路 径 。 另 外 ,在 导入 模块 时 ,会 优先 导入 相应 的 . pye X. 
件 , 如 果 相 应 的 . pye 文件 与 . py 文件 时 间 不 相符 或 不 存在 对 应 的 . pye 文件 , 则 导入 . py 
文件 。 

(ost. DEA import 语句 只 导入 一 个 标准 库 或 扩展 库 ; 回 按照 标准 库 、 扩 展 库 、 
自 定义 库 的 先后 顺序 进行 导入 。 
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Python 程序 除了 可 以 直接 运行 ,还 可 以 作为 模块 导入 并 使 用 其 中 的 对 象 。 通 过 __ 
name__ 属 性 可 以 识别 程序 的 使 用 方式 。 每 个 Python 脚本 在 运行 时 都 有 一 个 _name__ 属 
性 ,如 果 脚 本 作为 模块 被 导入 , 则 其 _name__ 属 性 的 值 被 自动 设置 为 模块 名 ;如 果 脚 本 独 
立 运行 , 则 其 _name 属性 值 被 自动 设置 为 字符 串 。_main _。 例 如 ,假设 程序 hello. py 
中 代码 如 下 : 


def main() : #def 是 用 来 定义 函数 的 Python 关键 字 
if nme  --' main ': # 选 择 结构 ,识别 当前 的 运行 方式 
print ("This program is run directly.') 
elif rme  --'hello': # 冒 号 ,换行 、 缩 进 表 示 一 个 语句 块 的 开始 


print ("his program is used as a module. ') 


mein() # 调 用 上 面 定义 的 函数 
那么 在 IDLE 中 直接 运行 该 程序 时 得 到 结果 如 下 : 
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This program is run directly. 
而 在 IDLE 交互 模式 中 使 用 import hello 导入 该 模块 时 ,得 到 结果 如 下 : 


This program is used as a module. 


KAMER: Python 没有 类 似 C/C++ /C Jt dt Java 中 用 来 限定 语句 块 的 大 括号 ， 
而 是 使 用 缩 进 来 体现 代码 之 间 的 从 属 关系 和 逻辑 关系 ,同一 个 级 别 的 代码 应 具有 相同 的 

对 于 大 型 软件 的 开发 ,不 可 能 把 所 有 代码 都 存放 到 一 个 文件 中 ,那样 会 使 得 代码 很 难 
维护 。 对 于 复杂 的 大 型 系统 ,可 以 使 用 包 来 管理 多 个 模块 。 包 是 Python 用 来 组 织 命名 
空间 和 类 的 重要 方式 ,可 以 看 作 是 包含 大 量 Python 程序 模块 的 文件 夹 。 在 包 的 每 个 目 
录 中 都 必须 包含 一 个 _init__. py 文件 ,该 文件 可 以 是 一 个 空 文件 ,用 于 表示 当前 文件 夹 
是 一 个 包 。__init__. py 文件 的 主要 用 途 是 设置 _all_ 变量 以 及 执行 初始 化 包 所 需 的 代 
码 , 其 中 __all__ 变 量 中 定义 的 对 象 可 以 在 使 用 “from…import * ”时 全 部 被 正确 导入 。 

假设 有 如 下 结构 的 包 : 

sound/ Top- level package 

init__.py Initialize the sound package 
fomats/ Subpackage for file format conversions 


effects/ Subpackage for sound effects 


filters/ Subpackage for filters 
equalizer.py 


voooder.py 
karacke.py 


那么 ,可 以 在 自己 的 程序 中 使 用 下 面 的 代码 导入 其 中 一 个 模块 : 
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然后 使 用 完整 名 字 来 访问 或 调用 其 中 的 成 员 ,例如 : 
sound.effects.echo.echofilter (input, output, delay- 0.7, atten- 4) 
如 果 sound\effects\__init__. py 文件 中 有 下 面 一 行 的 代码 : 
__all =['edho', 'surround', 'reverse'] 

那么 就 可 以 使 用 这 样 的 方式 来 导入 : 
fram sound.effects import * 


然后 使 用 下 面 的 方式 来 使 用 其 中 的 成 员 : 


echo.echofilter (input, output, delay- 0.7, atten- 4) 


P. I Python 序列 


Python 序列 类 似 于 C 或 Basic 中 的 一 维 、 多 维 数组 等 ,但 功能 要 强大 很 多 ,使 用 也 更 
加 灵活 ,方便 , Head First Python 一 书 中 就 戏称 列表 是 * 打 了 激素 "的 数组 。 

Python 中 常用 的 序列 结构 有 列表 、 元 组 \ 字 典 , 字 符 串 、 集 合 等 ,大 部 分 可 迁 代 对 象 也 
支持 类 似 于 序列 的 用 法 ,如 图 2-1 所 示 。 列 表 、 元 组 ,字符 串 等 序列 类 型 以 及 range 对 象 
均 支 持 双向 索引 ,第 一 个 元 素 下 标 为 0, 第 二 个 元 素 下 标 为 1, 以 此 类 推 ;如 果 使 用 负数 作 
为 索引 , 则 最 后 一 个 元 素 下 标 为 一 1 ,倒数 第 二 个 元 素 下 标 为 一 2, 以 此 类 推 。 可 以 使 用 负 
整数 作为 索引 是 Python 序列 的 一 大 特色 ,熟练 掌握 和 运用 它 可 以 大 幅度 提高 开发 效率 。 


列表 


有 序 序列 可 变 序列 


无 序 序列 不 可 变 序列 


range. zip. map- 
enumerate 


2-] Python 序列 分 类 示意 图 


《道德 经 )》 有 云 :“ 合 抱 之 木 , 生 于 毫 末 ; 九 层 之 台 ETRE TEZI TEF.” 
单 地 说 就 是 一 句 话 , 没 法 一 口吃 成 个 胖子 ,做 什么 都 要 一 步 步 来 ,尤其 不 要 忽视 基础 知识 
积累 的 重要 性 《庄子 道 遥 游 ) 也 认为 “上 且 夫 水 之 积 也 不 厚 , 则 其 负 大 舟 也 无 力 .” 没 有 坚 
实 的 基础 知识 做 支撑 和 后 盾 , 就 很 难 有 大 的 上 升 空 间 。 练 拳 不 练功 ,到 老 一 场 空 。 大 量 实 
际 开发 经 验 表 明 ,熟练 掌握 Python 基本 数据 结构 (尤其 是 序列 ) 的 用 法 可 以 更 加 快速 有 
效 地 解决 实际 问题 。 大 家 慢 慢 会 发 现 ,实际 工作 中 过 到 的 每 个 问题 最 终 都 会 用 到 一 些 基 
本 数据 结构 的 方法 或 内 置 函数 来 解决 , 恰 如 ( 道 德 经 所 说 “ 玄 之 又 玄 , 众 妙 之 门 ”。 这 一 音 
通过 大 量 案例 介绍 了 列表 、 元 组 .字典 、 集 合 等 几 种 基本 数据 结构 的 用 法 ,同时 还 有 range 
对 象 .zip 对 象 以 及 enumerate 对 象 的 巧妙 应 用 ,以 及 在 实际 应 用 中 非常 有 用 的 列表 推导 
式 、 切 片 操作 、 生 成 器 推导 式 等 。 


36 $ Python 可 以 这 样 学 


s 


2.1 列表 与 列表 推导 式 


列表 是 重要 的 Python 内 置 可 变 序列 之 一 ,是 包含 若干 元 素 的 有 序 连续 内 存 空间 。 
在 形式 上 ,列表 的 所 有 元 素 放 在 一 对 中 括号 *[ ”和 ”*]” 中 , 相 邻 元 素 之 间 使 用 逗号 分 隔 开 。 
当 列 表 增 加 或 删除 元 素 时 ,列表 对 象 自动 进行 内 存 的 扩展 或 收缩 ,从 而 保证 元 素 之 间 没 有 


AER. Python 列表 的 这 个 内 存 自动 管理 功能 可 以 大 幅度 减少 程序 员 的 负担 ,但 插入 和 删 
除非 尾部 元 素 时 会 涉及 列表 中 大 量 元 素 的 移动 ,效率 较 低 ,并 且 对 于 某 些 操作 可 能 会 导致 


操作 ,这 不 仅 可 以 大 幅度 提高 列表 处 理 速度 ,并 且 总 是 可 以 保证 得 到 正确 的 结果 。 

在 Python 中 ,同一 个 列表 中 元 素 的 数据 类 型 可 以 各 不 相同 ,可 以 同时 分 别 为 整数 、 
实数 ,字符 串 等 基本 类 型 ,也 可 以 是 列表 ,元 组 ,字典 ,集合 以 及 其 他 自 定义 类 型 的 对 象 。 
例如 ,下 面 几 个 都 是 合法 的 列表 对 象 

[10, 20, 30, 40] 

['crunchy frog', 'rambladder', 'lark vamit'] 

['spam', 2.0, 5, [10, 20]] 

[['£ilel', 200,7], ['file2', 260,9]] 

H3}, (5:69, 0, 2, 3] 


KAMER: Python 采用 的 是 基于 值 的 内 存 管理 模式 ,Python 变量 不 直接 存储 值 ， 


而 是 存储 值 的 引用 ,Python 列表 中 元 素 也 是 存储 值 的 引用 ,所 以 列表 中 各 元 素 可 以 是 不 
同类 型 的 数据 。 


211 列表 创建 与 删除 
使 用 “二 ”直接 将 一 个 列表 赋值 给 变量 即 可 创建 列表 对 象 ,例如 : 


>>>a list- ['a', 'b', mpilgrim', 'z', 'example'] 

»»»a list- [] # 创 建 空 列表 

也 可 以 使 用 list() 函 数 将 元 组 ,range 对 象 .字符 串 、. 字 典 、 集 合 或 其 他 类 型 的 可 迭代 
对 象 类 型 的 数据 转换 为 列表 。 需 要 注意 的 是 ,把 字典 转换 为 列表 时 默认 是 将 字典 的 “ 键 ” 
转换 为 列表 ,而 不 是 把 字典 的 元 素 转换 为 列表 ,如 果 想 把 字典 的 元 素 转换 为 列表 ,需要 使 
用 字典 对 象 的 items() 方 法 明确 说 明 。 例 如 : 


»»»a list= list((3,5,7,9,11)) # 将 元 组 转换 为 列表 
»»»a list 

[3, 5, 7, 9, 1] 

>>> list (range (1,10,2)) # 将 range 对 象 转换 为 列表 
[1, 3, 5, 7, 9] 

>>> list (hello world') # 将 字符 串 转换 为 列表 


[hv ev '1', Lv 'o', ' ', "w', ov "zr", "17, add] 


»»»1list((3,7,5) 

B, 5, 7] 

»»»list(('a':3, 'b':9, 'c':78]) 

iai 36, o 

»»»list(('a':3, 'b':9, 'c':78).items()) 
[Cb', 9), ('c*, 78), ('a', 3] 
»»»x-listü 
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# 将 集合 转换 为 列表 
# 将 字典 的 " 键 " 哇 换 为 列表 
# 将 字典 的 " 键 : 值 " 对 转换 为 列表 


# 创 建 空 列表 


BE 小 知识 : 在 Python 社区 中 ,习惯 把 list() 还 有 后 面 很 快 就 会 学 到 的 tuple()、 
set() \dict() 这 样 的 函数 称 为 “工厂 函数 ”, 因 为 这 些 函 数 可 以 生成 新 的 数据 类 型 。 

创建 列表 之 后 ,可 以 使 用 整数 作为 下 标 来 访问 其 中 的 元 素 ,其 中 0 表示 第 1 个 元 素 ,1 
表示 第 2 个 元 素 ,2 表示 第 3 个 元 素 , 以 此 类 推 ;列表 还 支持 使 用 负 整数 作为 下 标 , 其 中 


一 1 表示 最 后 1 个 元 素 ,一 2 表示 倒数 第 2 个 元 素 , 一 3 表示 倒数 第 3 个 元 素 , 以 此 类 推 ， 


如 图 2-2 所 示 。 


»»»x-list(range(10)) 
>>> import randcm 
>>> randm. shuffle (x) 
>>>x 

[6, 8, 7, 1, 0, 9, 2, 4, 3, 5] 
>>>x[0] 

6 

>>>x[1] 

8 

>>>x[-1] 

5 

>>>x[-2] 

3 


第 1 个 元 素 ”第 2 个 元 素 
的 下 标 是 0 ”的 下 标 是 1 


# 创 建 列表 


# 把 列表 中 的 元 素 打 乱 顺 序 


# 访 问 第 1 个 元 素 


# 访 问 最 后 一 个 元 素 


第 3 个 元 素 
的 下 标 是 2 正 向 索引 


[6, 8, 7, 1, 0,9, 2, 4, 3, 5] 


ugar] 全数 第 3 个 元 倒数 第 2 个 元 _ 最后! 个 元 
7) 素 的 下 标 是 -3 素 的 下 标 是 之 素 的 下 标 是 -1 


图 2-2 双向 索引 示意 图 


当 一 个 列表 不 再 使 用 时 ,可 以 使 用 del 命令 将 其 删除 ,这 一 点 适用 于 所 有 类 型 的 
Python 对 象 。 另 外 ,也 可 以 使 用 del 命令 删除 列表 ,字典 等 可 变 序 列 中 的 部 分 元 素 ,而 不 
能 删除 元 组 、 字 符 串 等 不 可 变 序 列 中 的 部 分 元 素 。 例 如 : 


»»»x-[L 2, 3] 
»»»delx[l] 


# 删 除 列表 中 指定 位 置 的 元 素 
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>>>x 
[1, 3l 
>>>delx # 删 除 列表 对 象 
>>>x # 对 象 删除 后 无 法 再 访问 , 抛 出 异常 


Traceback (most. recent. call last): 
File "< pyshell#58> ", line 1, in «module» 
x 
NameError: name 'x' is not defined 


22»x-('a':3, 'b':6, 'c':9) 


»»»del x['a'] # 删 除 字典 中 部 分 元 素 
>>>x 

{'c': 9, 'b': 6) 

»»»x-(,2,3) # 创 建 元 组 对 象 

>>> del x[0] # 不 允许 删除 元 组 中 的 元 素 


Traceback (most recent call last): 
File "«pyshellf63» ", line 1, in «module» 


del x[0] 
TypeError: 'tuple' dbject doesn't support item deletion 
»»»x[0]- 4 # 也 不 能 修改 元 组 中 的 元 素 值 


Traceback (most. recent. call last): 
File "«pyshellfl» ", line 1, in «module» 
x[0]- 4 
TypeError: 'tuple' dbject does not support item assignment 


(QARAR: 垃圾 回收 机 制 。 一 般 来 说 ,使 用 del 删除 对 象 之 后 Python 会 在 恰当 


的 时 机 调用 垃圾 回收 机 制 来 释放 内 存 , 我 们 也 可 以 在 必要 的 时 候 导入 Python 标准 库 gc 
之 后 调用 gc. collect() 函 数 立 刻 启 动 垃圾 回收 机 制 来 释放 内 存 。 
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《 象 ) 日 “君子 以 同 而 异 ”。 对 于 Python 中 不 同 的 序列 类 型 而 言 , 有 很 多 方法 是 通用 
的 ,而 不 同类 型 的 序列 又 有 一 些 特 有 的 方法 或 支持 某 些 特 有 的 运算 符 。 常 用 的 列表 对 象 
方法 如 表 2-1 所 示 。 另 外 ,Python 的 很 多 内 置 函 数 和 命令 也 可 以 对 列表 和 其 他 序列 对 象 
进行 操作 ,后 面 章 节 中 将 通过 一 些 案例 陆续 进行 介绍 。 


R21 常用 的 列表 对 象 方法 


方 法 说 oH 
Ist. append( x) 将 元 素 x 添加 至 列表 Ist 尾部 
lst. extend(L) 将 列表 L 中 所 有 元 素 添 加 至 列表 lst 尾部 


在 列表 Ist 指定 位 置 index 处 添加 元 素 x, 该 位 置 后 面 的 所 有 元 素 后 移 一 个 
位 置 


lst. insert(index, x) 
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Ej 

3 法 说 明 
i vot ay id Ist 中 删除 首次 出 现 的 指定 元 素 ,该 元 素 之 后 的 所 有 元 素 前 移 一 个 
Ist. pop([index]) 删除 并 返回 列表 Ist 中 下 标 为 index( 默 认为 一 1) 的 元 素 
Ist. clear) 删除 列表 lst 中 的 所 有 元 素 , 但 保留 列表 对 象 
berei "ded lst 中 第 一 个 值 为 x 的 元 素 的 下 标 , 若 不 存在 值 为 x 的 元 素 则 抛 出 异 
Ist. count(x) 返回 指定 元 素 x 在 列表 lst 中 的 出 现 次 数 
Ist. reverse) 对 列表 Ist 所 有 元 素 进行 逆序 
Ist. sort(key— None, | 对 列表 Ist 中 的 元 素 进 行 排序 , key 用 来 指定 排序 依据 , reverse 决定 升序 
reverse— False) (False) 还 是 降序 (True) 
Ist. copyO 返回 列表 Ist 的 浅 复制 , 浅 复制 的 介绍 参考 2. 1.4 节 


1. append() .insert() .extend() 


存 中 的 起 始 地 址 。 


»»»x-[ 2, 3] 

»»»id(x) # 查 看 对 象 的 内 存 地 址 
50159368 

>> >x.append(4) # 在 尾部 追加 元 素 
>>>x 

LL 2, 3, 4] 

>>>x.insert (0, 0) # 在 指定 位 置 插入 元 素 
>>>x 

[0, 1, 2, 3, 4] 

>>>x.extend([5, 6, 7]) # 在 尾部 追加 多 个 元 素 
>>>x 

[0, 1, 2, 3, 4, 5, 6, 7] 

»»»id(x) # 列 表 在 内 存 中 的 地 址 不 变 


50159368 

另外 ,运算 符 十 和 * 也 可 以 实现 列表 增加 元 素 的 目的 ,但 这 两 个 运算 符 不 属于 原 地 操 
作 , 而 是 返回 新 列表 。 

>>> [L 2, 3] 


»»»id(x) 
50232456 
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»»»x-xt [4] # 连 接 2 个 列表 
>>>x 

[1, 2, 3, 4] 

»»»id() # 内 存 地 址 发 生 改 变 
50159368 

»»»x-x * 2 LL 
>>>x 

[L 2, 3, 4, 1, 2, 3, 4] 

»»»id(x) 

50226952 


2. popO ,removeO ,clearC) 


这 3 个 方法 用 于 删除 列表 中 的 元 素 , 其 中 ,pop() 用 于 删除 并 返回 指定 位 置 (默认 是 最 
后 一 个 ) 上 的 元 素 ,remove() 用 于 删除 列表 中 第 一 个 值 与 指定 值 相等 的 元 素 ,clear() 用 于 
清空 列表 ,这 3 个 方法 属于 原 地 操作 ,不 影响 列表 对 象 的 内 存 地 址 。 另 外 ,也 可 以 使 用 del 


命令 删除 列表 中 指定 位 置 的 元 素 , 也 属于 原 地 操作 。 


»»»x-[L 2, 3, 4, 5, 6, 7] 


»»»x. po # 弹 出 并 返回 尾部 元 素 

了 

>>>x.pop(0) # 弹 出 并 返回 指定 位 置 的 元 素 
1 

»»»x.clear() # 删 除 所 有 元 素 

>>>x 


g 

>>> [1, 2, 1, 1, 2] 

»»»x.remove(2) # 删 除 首 个 值 为 2 的 元 素 
>>>x 

LLLA 

>>> del x[3] # 删 除 指定 位 置 上 的 元 素 
>>>x 

LL, 1, 1] 


3. countO ,index() 


列表 方法 count() 用 于 返回 列表 中 指定 元 素 出 现 的 次 数 ,index() 用 于 返回 指定 元 素 
在 列表 中 首次 出 现 的 位 置 ,如 果 该 元 素 不 在 列表 中 则 抛 出 异常 。 除 此 之 外 ,成 员 测 试 运算 
符 in 也 可 以 测试 列表 中 是 否 存 在 某 个 元 素 。 


2»»x-[1,2,2,3,3, 3, 4,4, 4, 4] 
»»»x.coumt (3) SX 3 在 列表 x 中 出 现 的 次 数 
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3 


>>>x.count (5) 


0 

>>>x.index(2) # 元 素 2 在 列表 x 中 首次 出 现 的 索引 
1 

»»»x.index(4) 

6 

»»»x.index(5) # 列 表 x 中 没有 5, 抛 出 异常 


Traceback (most recent call last): 
File "x pyshell£102» ", line 1, in «module» 
x.index(5) 
Value&rror: 5 is not in list 
»»»5inx #5 不 是 列表 x 的 元 素 
False 
»»»3inx 


True 


4. sort) ,reverse( ) 


一 提 到 排序 ,有 其 他 语言 编程 经 验 的 读者 脑海 里 立刻 会 涌现 出 冒 泡 法 .选择 法 .插入 
法 .快速 排序 等 名 词 , 以 及 烦琐 的 代码 和 让 人 头痛 的 循环 边界 条 件 , 而 逆序 也 涉及 大 量 元 
素 的 交换 操作 和 循环 边界 的 控制 。 虽 然 学 习 和 掌握 各 种 排序 算法 的 过 程 会 锻炼 我 们 严谨 
的 逻辑 思维 能 力 ,但 实际 运用 中 我 们 更 希望 简单 一 些 。 试 想 ,如 果 只 需要 把 排序 的 要 求 明 
确 地 告诉 计算 机 ,计算 机 就 能 立刻 满足 我 们 的 要 求 , 那 将 会 是 一 种 什么 样 的 体验 ! 至 于 计 
算 机 内 部 是 如 何 实现 排序 的 , 谁 会 关心 ! 

列表 对 象 的 sort() 方 法 用 于 按照 指定 的 规则 对 所 有 元 素 进行 排序 ,默认 规则 是 直接 
比较 元 素 大 小 ;reverse() 方 法 用 于 将 列表 所 有 元 素 逆序 排列 。 


»»»x-list(range(11)) # 包 含 11 个 整数 的 列表 
>>> import randcm 

>>> randm. shuffle (x) # 随 机 乱 序 

>>>x 


[6, 0, 1, 7, 4, 3, 2, 8, 5, 10, 9] 
»»»x.sort (key= lambda item:len(str(item)), reverse- True) 
# 按 指定 规则 排序 
>>>x 
[10, 6, 0, 1, 7, 4, 3, 2, 8, 5, 9] 
»»»x.reverse() # 逆 序 
>>>x 
[9, 5, 8, 2, 3, 4, 7, 1, 0, 6, 10] 
»»»x.sort (key- str) # 按 转换 为 字符 串 后 的 大 小 排序 
»»»x 


I0, 1, 10, 2, 3, 4, 5, 6, 7, 8, 9] 
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»»»x.sort() # 按 默认 规则 排序 


»»»Xx 


[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 


需要 注意 的 是 ,列表 对 象 的 sort OO 和 reverse() 是 对 列表 进行 原 地 排序 (in-place 


sorting) 和 逆序 。 所 谓 * 原 地 ”, 意 思 是 用 处 理 后 的 数据 鞭 换 原来 的 数据 ,列表 中 元 素 原来 
的 顺序 全 部 丢失 。 如 果 原 来 的 顺序 不 想 丢失 ,可 以 使 用 内 置 函 数 sorted() 和 reversed() 


»»»x-list(range(11)) 

>>> inport randm 

>>> randm. shuffle (x) # 打 乱 顺 序 

>>>x 
2, 4, 0, 6, 10, 7, 8, 3, 9, 1, 5] 
>>> sorted(x) # 以 默认 规则 排序 
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
>> > sorted (x, key- lambda item:len(str(item)), reverse- True) 

# 以 指定 规则 排序 

10, 2, 4, 0, 6 7, 8, 3, 9, 1, 5] 
>>> sorted(x, key= str) # 以 指定 规则 排序 
0, 1, 10, 2, 3, 4, 5, 6, 7, 8, 9] 
>>>x 
2, 4, 0, 6, 10, 7, 8, 3, 9, 1, 5] 
>>> reversed(x) HJF 
<list_reverseiterator dbject at 0x0000000003089E48» 
>>> list (reversed (x) ) 
5, 1, 9, 3, 8, 7, 10, 6, 0, 4, 2] 


ANER: 上 面 的 几 段 代码 中 用 到 了 lambda 表达 式 , 有 关 知 识 请 参考 3. 3. 4 节 。 
(QARAR: 排序 方法 的 key 参数 。 充 分 利用 列表 对 象 的 sort() 方 法 和 内 置 函数 


sorted() 的 key 参数 ,可 以 实现 更 加 复杂 的 排序 ,以 内 置 函数 sorted() 为 例 : 


>>> gameresult= [['Bdb', 95.0, 'A'], 
['Alan', 86.0, 'C'], 
['Mandy', 83.5, 'A'], 
['Rcb', 89.3, 'E']] 

>>> frm erator import itemgetter 


»»»sorted(gameresult, key- itemgetter (2) ) # 按 子 列表 第 3 个 元 素 进行 升序 排序 
[['Bdb', 95.0, 'A'], ['Mandy', 83.5, 'A'], ['Alan', 86.0, 'C'], ['Rcb', 89.3, 'E']] 
>>> sorted (gameresult, key- itemgetter (7, 0)) # 按 第 3 个 元 素 升 序 , 然 后 按 第 1 个 升序 


[['Bcb', 95.0, 'A'], ['Mandy', 83.5, 'A'], ['Alan', 86.0, 'C'], ['Rcb', 89.3, 'E']] 
»»»sorted(gameresult, key- itemgetter (2, 0), reverse- True) 
[['Rcb', 89.3, "E'], ['Alan', 86.0, 'C'], ['Mandy', 83.5, 'A'], ['Bcb', 95.0, 'A']] 
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>>> listl= ["what", "I'm", "sorting", "by"] # 以 一 个 列表 内 容 为 依据 
>>> list2- [sauething", "else", "to", "sort"] # 对 另 一 个 列表 内 容 进 行 排序 
»»»pairs-zip(listl, list2) # 把 两 个 列表 中 的 对 应 位 置 元 素 配 对 


>>> [item[1] for item in sorted(pairs, key- lambda x:x[0], reverse- True)] 

['sarething', 'to', 'sort', 'else'] 

>>> [[L, 2, 3], [2, 1, 4], [2, 2, 11] # 以 第 2 个 元 素 升序 、 第 3 个 元 素 降序 排序 
>>> sorted(x, key- lambda item: (item[1], - item[2])) 

U2, 1, 4), [1, 2, 3), (2, 2, 1]] 

»»»x- ['aaaa', 'bc', 'd', 'b', "ba'] # 先 按 长 度 排序 ,长 度 一 样 的 正常 排序 
>>> sorted (x, key- lambda item: (len(item), item)) 

['b', 'd', 'ba', 'bc', 'aaaa'] 


5. 内 置 函数 对 列表 的 操作 


除了 列表 对 象 自身 方法 之 外 ,很 多 Python 内置 函 数 也 可 以 对 列表 进行 操作 。 例 如 ， 
max()、min() 函 数 用 于 返回 列表 中 所 有 元 素 的 最 大 值 和 最 小 值 ,sum() 气 数 用 于 返回 数 
值 型 列表 中 所 有 元 素 之 和 ,len() 函 数 用 于 返回 列表 中 元 素 个 数 ,zip() 函 数 用 于 将 多 个 列 
表 中 元 素 重新 组 合 为 元 组 并 返回 包含 这 些 元 组 的 zip 对 象 ,enumerate() 函数 返回 包含 若 
干 下 标 和 值 的 迭代 对 象 。 


»»»x-list(range (11)) # 生 成 列表 

> > > import randcm 

>>> randa. shuffle (x) # 打 乱 列 表 中 元 素 顺 序 

>>>x 

[0, 6 10, 9, 8, 7, 4, 5, 2, 1, 3] 

>>>max(x) # 返 回 最 大 值 

10 

»»»mex(x, key- str) # 按 指定 规则 返回 最 大 值 

9 

»»»min(x) 

0 

>>> sm(x) # 所 有 元 素 之 和 

55 

>>> len(x) # 列 表 元 素 个 数 

n 

>>> list (zip(x, [1] * 11)) # 多 列表 元 素 重新 组 合 

[(0, 1), (6, 1), Q0, 1), (9, 1), (6, 2, C, 2, 4, 1), 6, 0, C, 2,0, 1), (3, 1)] 

>>> list (zip (range (1,4))) #zip() 函 数 也 可 以 用 于 一 个 序列 或 迭代 对 象 
[0,), 2), G1 

»»»list(zip(['a', 'b', 'c'], [1, 2])) # 如 果 两 个 列表 不 等 长 ,以 短 的 为 准 
[('a', 1), ('b', 2)] 

>> > enumerate (x) # 枚 举 列表 元 素 ,返回 enumerate 对 象 


<enumerate cbject at 0x00000000030A9120»- 
>>> list (enumerate (x)) #enumerate 对 象 可 和 迭代 
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LO, 0), (1, 9, (2, 10), G, 9, 4, 8, (5, D, (6, 9, (7, 5, (8, 2), (9, 1), 00, 3] 


TE Python 中 ,map()、reduce(),filter() 是 函数 式 编程 的 重要 体现 形式 。 内 置 函 数 
map() 可 以 将 一 个 函数 依次 作用 (或 映射 ) 到 序列 或 迭代 器 对 象 的 每 个 元 素 上 ,并 返回 一 
个 map 对 象 作为 结果 ,其 中 ,每 个 元 素 是 原 序 列 中 元 素 经 过 该 函数 处 理 后 的 结果 ,不 对 原 
序列 或 迭代 器 对 象 做 任何 修改 。 下 面 的 代码 用 到 后 面 章节 的 知识 ,大 家 如 果 看 不 懂 的 话 
也 不 要 焦虑 ,一 本 好 书本 来 就 是 需要 前 后 反复 翻 看 很 多 遍 才 能 融会 贯通 的 , 正 所 谓 “ 书 读 
百 遍 ,其 义 自 见 ”。 


>>> list (map (str, rang (5))) # 转 换 为 字符 串 
Not, 3t 92e; 89, cse] 
»»»def adib(v): # 单 参数 函数 
retum vt5 
>>> list (map(add5, range (10))). # 把 单 参数 函数 映射 到 一 个 序列 的 所 有 元 素 
5, 6, 7, 8, 9, 10, 11, 12, 13, 1M] 
>>> def add(x, y): # 可 以 接收 2 个 参数 的 函数 
return xt y 
>>> list (map (acd, range (5), range (5,10))) # 把 双 参 数 函 数 映射 到 两 个 序列 上 
5, 7, 9, 11, 13] 
>>> list (nap (lambda x, y: x* y, range (5), range(5,10))) 
5, 7, 9, 11, 13] 
>>> [add(x, y) for x, y in zip(range (5), range (5,10))] 
5, 7, 9, 11, 13] 


标准 库 functools 中 的 函数 reduce() 可 以 将 一 个 接收 2 个 参数 的 函数 以 累积 的 方式 
从 左 到 右 依 次 作用 到 一 个 序列 或 达 代 器 对 象 的 所 有 元 素 上 。 


>> > fram functools import reduce 
»»»sec- [1, 2, 3, 4, 5, 6, 7, 8, 9] 


>>> reduce (add, range (10)) #ada 是 上 一 段 代 码 中 定义 的 函数 
45 
>>> reduce (lanbda x, y: x+y, seg) # 使 用 lanbda 表达 式 实现 相同 功能 


45 

上 面 的 代码 运行 过 程 如 图 2-3 所 示 。 

aL IRR 在 Python 2. x 中 ,reduce() 是 内 置 函 数 ,不 需要 导入 任何 模块 即 可 
使 用 。 

内 置 函 数 filter() 将 一 个 单 参数 函数 作用 到 一 个 序列 上 ,返回 该 序列 中 使 得 该 函数 返 
回 值 为 True 的 那些 元 素 组 成 的 filter 对象, 如 果 指 定 函 数 为 None, 则 返回 序列 中 等 价 于 
True 的 元 素 。 

>>> seq- ['foo', 'x4l', '21', xx'] 

>>> def func(x): 


return x.isalnum() # 测 试 是 否 为 字母 或 数字 
>>> filter(func, seg) # 返 回 filter 对 象 
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2-3 ”reduce() 函数 执行 过 程 示意 图 


< filter dbject at 0x000000000305D898» 


>>> list (filter (func, seq)) HE filter 对 象 转换 为 列表 
'foo', 'x41'] 
>>> seq # 不 对 原 列 表 做 任何 修改 
'foo', 'x4l', '21', eee] 
>>> [x for x in seq if x.isalnum()] # 使 用 列表 推导 式 实 现 相同 功能 
'foo', 'x4l'] 
>>> list (filter lambda x: x.isalnm(), seq)) # 使 用 larbda 表 达 式 实现 相同 功能 
'foo', 'x41'] 
>>> list (filter None, [1, 2, 3, 0, 0, 4, 0, 5])) # 指 定 函 数 为 None 
1,2,3,4,5 


AMER: max( ),min(),len() , zipC) , enumerate ( ) , sorted () , reversed) , map()、 
filter() 等 内 置 函数 以 及 成 员 测 试 运算 符 in 也 适用 于 列表 对 象 , 以 及 元 组 、 字 符 串 。 

(QERAR: 使 用 列表 模拟 向 量 运算 。Python 列表 支持 与 整数 的 乘法 运算 ,表示 
列表 元 素 进行 重复 并 生成 新 列表 ,不 对 原 列表 进行 任何 修改 。 


»»»[L2,3] * 3 
[L 2, 3, 1, 2, 3, 1, 2, 3] 


Python 列表 不 支持 与 整数 的 加 \ 减 、 除 运算 ,也 不 支持 列表 之 间 的 减 、 乘 、 除 操作 。 列 
表 之 间 的 加 法 运算 表示 列表 元 素 的 合并 ,生成 新 列表 ,而 不 是 向 量 意义 的 加 法 。 


>>> [1, 2, 31+ [4, 5, 6] 
[1, 2, 3, 4, 5, 6] 
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数 ,或 者 向 量 之 间 的 加 \ 减 , 乘 运算 ,Python 列表 对 象 本 身 不 支持 这 样 的 操作 ,不 过 可 以 借 
助 于 内 置 函 数 和 标准 库 operator 中 的 方法 来 实现 ,或 者 使 用 扩展 库 numpy 实现 更 加 强大 
的 功能 。 


>>> inport randm 

>>>x= [randm.randint (1,100) for i in range (10)] # 生 成 10 个 [1,100] 区 间 内 的 随机 数 
>>>x 

[46, 76, 47, 28, 5, 15, 57, 29, 9, 40] 

>>> list map (lanbda i: i+5, x)) # 所 有 元 素 同时 加 5 

[51, 81, 52, 33, 10, 20, 62, 34, 14, 45] 

»»»x- [randm.randint (1,10) for i in range (10)] 

>>>x 

| 

>>> y= [randm.randint (1,10)for i in range(10)] 

>>>y 

[8, 1, 9, 7, 1, 5, 8, 4, 1, 9] 

>> > import operator 

>> > sum(tmap (cperator ml, x, y)) # 向 量 内 积 

278 

>>>sm((i* j fori, j in zip(x, y))) # 使 用 内 置 函数 计算 向 量 内 积 
278 

>>> list(map(cperator.add, x, y)) # 两 个 等 长 的 向 量 对 应 元 素 相 加 
[10, 3, 18, 13, 8, 14, 10, 5, 3, 16] 

>>> list nap(lanbda i,j: i+j, x, y)) HEH landa 表达 式 实现 同样 效果 
[10, 3, 18, 13, 8, 14, 10, 5, 3, 16] 


列表 可 以 说 是 Python 功能 最 强大 的 数据 类 型 之 一 ,提供 了 大 量 的 方法 支持 各 种 操 
作 , 同 时 很 多 Python 内 置 函数 也 可 以 作用 于 列表 。 看 起 来 非常 复杂 的 样子 ,确实 不 太 好 
记 。 当 和 暂时 还 是 菜鸟 的 你 看 到 Python 高 手 运 指 如 飞 , 行 云 流水 一 样 完成 一 个 又 一 个 功 
能 ,然后 一 脸 崇 拜 地 问 高 手 如 何 才能 记得 住 那么 复杂 的 东西 ,高 手 ( 按 最 近 网 络 小 说 流行 
的 风格 ,此 处 高 手 应 该 会 先 打 个 响 指 ) 很 可 能 会 淡淡 地 给 你 一 个 令 人 抓 狂 的 答案 “无 他 , 唯 
手 熟 尔 ”。 是 的 ,高 手 没有 忽悠 你 ,要 想 精 通 , 就 是 要 多 练 ,多 动手 才能 真正 理解 ,才能 出 神 
入 化 。 不 要 只 鲜 幕 高 手 编写 代码 时 的 潇洒 和 写意 ,更 要 看 到 高 手背 后 的 努力 和 拼搏 。 
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列表 推导 式 可 以 说 是 Python 程序 开发 时 应 用 最 多 的 技术 之 一 ,在 1.3.2 节 曾 经 展示 
过 如 何 使 用 列表 推导 式 生成 包含 随机 数 的 列表 。 列 表 推 导 式 可 以 使 用 非常 简洁 的 方式 来 
快速 生成 满足 特定 需求 的 列表 ,代码 具有 非常 强 的 可 读 性 。 另 外 ,Python 的 内 部 实现 对 
列表 推导 式 做 了 大 量 优化 ,可 以 保证 很 快 的 运行 速度 。 列 表 推 导 式 的 语法 形式 为 


RAR for 变量 mn 序列 或 迭代 对 象 ] 
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列表 推导 式 在 逻辑 上 相当 于 一 个 循环 ,只 是 形式 更 加 简洁 ,例如 : 


»»»alist- [x* x for x in range(10)] 
相当 于 


»»»alist-[] 
>>> for x in range(10): 
alist.append(x* x) 


当然 也 等 价 于 
»»»aList- list (map (lanbda x: x* x, range(10))) 
而 
>>> freshfruit= [' banana', ' loganberry ', 'passion fruit '] 
»»»alist- [w.strip()for w in freshfruit] 

则 等 价 于 下 面 的 代码 : 
>>> freshfruit= [' banana', ' loganberry ', 'passion fruit '] 
>>>aList= [] 


>>> for item in freshfruit: 
alist.append(item.strip()) 


也 等 价 于 


>>> freshfruit= [' banana', ' loganberry ', 'passion fruit '] 
»»»aList-list (map (lambda x: x.strip(), freshfruit)) 


或 

>>> freshfruit- [' banana', ' loganberry ', 'passion fruit '] 

>>>alist= list (map(str.strip, freshfruit)) 

大 家 应 该 看 过 一 个 故事 ,说 是 阿 凡 提 ( 也 有 的 说 是 阿 基 米 德 ,这 不 是 重点 ) 与 国王 比赛 
下 棋 , 国 王 说 要 是 自己 输 了 的 话 阿 凡 提 想 要 什么 他 都 可 以 拿 得 出 来 。 阿 凡 提 说 那 就 要 点 
米 吧 ,棋盘 一 共 64 个 小 格子 ,在 第 一 个 格子 里 放 1 粒 米 ,第 二 个 格子 里 放 2 粒 米 ,第 三 个 
格子 里 放 4 粒 米 ,第 四 个 格子 里 放 8 粒 米 , 以 此 类 推 ,后 面 每 个 格子 里 的 米 都 是 前 一 个 格 
子 里 的 2 倍 ,一 直 把 64 个 格子 都 放 满 。 结 果 可 想 而 知 ,最 后 国王 没有 办 法 拿 出 那么 多 米 。 
那么 到 底 需要 多 少 粒 米 呢 ,其 实 使 用 列表 推导 式 再 结合 内 置 函 数 sum() 就 很 容易 知道 
答案 。 


»»»sun([2-*i for i in range (64)]) 
18446744013709551615 


接 下 来 再 通过 几 个 示例 来 进一步 展示 列表 推导 式 的 强大 功能 。 
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1. 使 用 列表 推导 式 实现 谋 套 列表 的 平 铺 


>>>vec= [[l, 2, 3], [4, 5, 6], [7, 8, 9]] 
>>> [num for elem in vec for num in elem] 
[L 2, 3, 4, 5, 6, 7, 8, 9] 


在 这 个 列表 推导 式 中 有 2 个 循环 ,其 中 第 一 个 循环 可 以 看 作 是 外 循环 ,执行 得 慢 ; 而 


第 三 个 循环 可 以 看 作 是 内 循环 ,执行 得 快 。 上 面 代码 的 执行 过 程 等 价 于 下 面 的 写法 : 


>>>vec= [[1, 2, 3], [4, 5, €], [7, 8, 9]] 
>>> result= [] 
>>> for elem in vec: 
for num in elem: 
result.append (num) 
>>> result 
[1, 2, 3, 4, 5, 6, 7, 8, 9] 


2. 过 滤 不 符合 条 件 的 元 素 


在 列表 推导 式 中 可 以 使 用 庄子 句 来 进行 筛选 ,只 在 结果 列表 中 保留 符合 条 件 的 元 
素 。 例 如 ,下 面 的 代码 可 以 列 出 当前 文件 夹 下 所 有 Python 源 文件 : 


>>> inport os 
>>> [filename for filename in os.listdir('.')if filename.endswith(' .py") ] 


下 面 的 代码 用 于 从 列表 中 选择 符合 条 件 的 元 素 组 成 新 的 列表 : 


»»»alist- [-1, -4, 6, 7.5, -2.3 9, - 11] 
>>> [i fori in alist if i>0] # 所 有 大 于 0 的 数字 
[6, 7.5, 9] 


再 例如 ,已 知 有 一 个 包含 一 些 同学 成 绩 的 字典 ,计算 成 绩 的 最 高 分 .最 低 分 ,平均 分 ， 
并 查找 所 有 最 高 分 的 同学 ,代码 可 以 这 样 编写 


>>> scores= ("Zhang San": 45, "Li Si": 78, "Wang Wu": 40, "Zhou Liu": 96, "Zhao Qi": 65, "Sun Ba": 90, " 
Zheng Jiu": 78, "Wa Shi": 99, "Dong Shiyi": 60) 

>> > highest- mex (scores.values () ) # 最 高 分 

>>> lowest-min (scores.values ()) # 最 低 分 

»»»highest 

99 

>>> lowest 

40 

> > > average= sum (scores.values () ) /len (scores) # 平 均 分 

>>> average 

72.33333333333333 

> > > highestPerson= [name for name, score in scores.items()if score ==highest] 
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>>>highestPerson 
[wa Shi'] 


下 面 的 代码 使 用 列表 推导 式 查找 列表 中 最 大 元 素 的 位 置 : 


> > > fram randam import randint 

»»»x-[randint(l, 10)for i in range (20)] 

»»»m-max(x) 

>>>m 

10 

>>> [index for index, value in enumerate (x)if value ==m] 
[0, 5, 6, 10] 

>>>x 

[10, 2, 3, 4, 5, 10, 10, 9, 2, 4, 10, 8, 2, 2, 9, 7, 6, 2, 5, 6] 


3. 在 列表 推导 式 中 使 用 多 个 循环 ,实现 多 序列 元 素 的 任意 组 合 , 并 且 可 以 结合 条 
件 语 句 过 滤 特 定 元 素 

>>> [(x, y)for x in [1, 2, 3] for y in [3, 1, 4] i£ x !- y] 

[th 3,0, 9,0, 35,6, 0,0, 9, G, 0, G, 9] 

EFE: UT G4 b sa p RAE A ZRA S AMR UTR SUE 
套 关系 ”。 例 如 ,上 面 的 代码 等 价 于 

>>> result= [] 

»»»forx in [1, 2, 3]: 

for y in [3, 1, 4]: 
if x !=y: 


result.append((x, y) ) 
»»»result 


iA, 3,0, 9,0, 3), (2, 0,0, 9,G, 1), (3, 9] 


4. 使 用 列表 推导 式 实现 矩阵 转 置 
下 面 的 代码 使 用 列表 推导 式 实现 矩阵 转 置 : 


>>>mtri® [ [1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]] 
>>> [[rowli] for row in matrix] for i in range (4)] 
[[ 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]] 


或 者 ,也 可 以 使 用 内 置 函 数 zipO RI list() 来 实现 矩阵 转 置 : 


>>> list map(list,zip(* matrix))) 
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]] 


EEE: 对 于 谱 套 了 列表 推导 式 的 列表 推导 式 , 一 定 要 清楚 其 执行 顺序 。 例 如 ,上 
面 列表 推导 式 的 执行 过 程 等 价 于 下 面 的 代码 ,可 以 看 出 ,使 用 列表 推导 式 更 加 简洁 ,代码 
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可 读 性 更 强 。 


»»»matrix- [ [1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]] 
»»»result- [] 
>>> for i in rang (len (matrix)): 

ta [] 

for row in matrix: 

temp.append (row[i]) 

result.append (temp) 
>>> result 
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]] 


5. 列表 推导 式 中 可 以 使 用 函数 或 复杂 表达 式 


»»»deff(v): 
if v2 ==0: 
Wi2 
else: 
wl 
return v 
»»»print([f(v)for v in [2, 3, 4, - 1] if v> 0]) 
[4, 4, 16] 
»»»print([v**2 if v$2 ==0 else vc 1 for v in [2, 3, 4, - 1] if v> 0]) 
[4, 4, 16] 


6. 列表 推导 式 支 持 文件 对 象 迭 代 


>>> fp-open('C: Vinstall.log', 'r') 
»»»print([Line for line in fp]) # 为 节约 篇 幅 , 这 里 没有 给 出 代码 的 运行 结果 
»»»Ífp.close() 


7. 使 用 列表 推导 式 生 成 100 以 内 的 所 有 素数 


>>> [p for p in range (2, 100)if 0 not in [Psd for d in range(2, int(sart(p))*1)] ] 
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 41, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97] 
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切片 也 是 Python 序列 的 重要 操作 之 一 ,在 形式 上 ,切片 使 用 2 个 冒号 分 隔 的 3 个 数 
字 来 完成 ,第 一 个 数字 表示 切片 的 开始 位 置 (默认 为 0) ,第 二 个 数字 表示 切片 的 截止 (但 
不 包含 ) 位 置 (默认 为 列表 长 度 ) ,第 三 个 数字 表示 切片 的 步 长 (默认 为 1) , 当 步 长 省 略 时 
可 以 同时 省 略 最 后 一 个 冒号 。 

切片 适用 于 列表 、 元 组 .字符 串 .range 对 象 等 类 型 ,应 用 于 列表 时 具有 最 为 强大 的 功 
能 。 可 以 使 用 切片 来 截取 列表 中 的 任何 部 分 返回 得 到 一 个 新 列表 ,也 可 以 通过 切片 来 修 
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改 和 删除 列表 中 的 部 分 元 素 , 甚 至 可 以 通过 切片 操作 为 列表 对 象 增加 元 素 。 
1. 使 用 切片 获取 列表 中 的 部 分 元 素 


使 用 切片 可 以 返回 列表 原 有 元 素 的 一 个 “ 子 集 ”。 与 使 用 下 标 访问 列表 元 素 的 方法 不 
同 ,切片 操作 不 会 因为 下 标 越界 而 地 出 异常 ,而 是 简单 地 在 列表 尾部 稚 断 或 者 返回 一 个 空 


列表 ,代码 具有 更 强 的 健壮 性 。 


»»»aList- [3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 

»»»alist[::] # 返 回 包含 原 列表 中 所 有 元 素 的 新 列表 

[3, 4, 5 6 7 9, 11, 13, 15, 17] 

»»»alist[::-1] # 返 回 包含 原 列 表 中 所 有 元 素 的 逆序 列表 

17, 15, 13, 11, 9, 7, 6, 5, 4, 3] 

»»»alist[::2] # 隔 一 个 元 素 取 一 个 元 素 ,获取 偶数 位 置 的 元 素 
3, 5, 7, 11, 15] 

>>> arist[1::2] # 隔 一 个 元 素 取 一 个 元 素 ,获取 奇数 位 置 的 元 素 
4, 6, 9, 13, 17] 

»»»alist[3:6] # 指 定 切片 的 开始 位 置 和 结束 位 置 

6, 7, 9] 

>>> aList[0:100] # 切 片 的 结束 位 置 大 于 列表 长 度 时 ,从 列表 尾部 截断 
3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 

»»»alist[100:] # 切 片 的 开始 位 置 大 于 列表 长 度 时 ,返回 空 列表 
] 

»»»alist[100] # 抛 出 异常 ,不 允许 越界 访问 


IndexError: list index out of range 


2. 使 用 切片 对 列表 元 素 进行 增 、 删 \ 改 


可 以 使 用 切片 操作 来 快速 实现 很 多 目的 ,例如 , 原 地 修改 列表 内 容 , 列 表 元 素 的 增 、 
删改 以 及 元 素 蔡 换 等 操作 都 可 以 通过 切片 来 实现 ,并 且 不 影响 列表 对 象 的 内 存 地 址 。 


»»»aList- [3, 5, 7] 

»»»aList[len(aList) :] 

0 

>>>aList[len(aList) :]= [9] # 在 列表 尾部 增加 元 素 
»»»aList 

D, 5, 7, 9] 

»»»alist[:3]- [1, 2, 3] LEE UE 
»»»aList 

4, 2, 3, 9] 

»»»alist[:3]- [] # 删 除 列表 元 素 
»»»aList 

[9] 

>>>alist= list (range (10) ) 

»»»aList 
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I0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 

>>>aList[::2]= [0] * (len (aList)//2) # 蔡 换 列 表 元 素 

»»»aList 

I0, 1, 0, 3, 0, 5, 0, 7, 0, 9] 

»»»alist[3:3]- [4, 5, 6] # 在 列表 指定 位 置 插入 元 素 
»»»alist 

[0, 1, 0, 4, 5, 6, 3, 0, 5, 0, 7, 0, 9] 

>>> len (aList) 

13 

>>>aList[20:30]= [3] * 2 # 这 样 也 可 以 在 尾部 追加 元 素 ,注意 切片 的 范围 
>>>alist 

[0, 1, 0, 4, 5, 6, 3, O, 5, 0, 7, O, 9, 3, 3] 


另外 ,也 可 以 结合 使 用 del 命令 与 切片 结合 来 删除 列表 中 的 部 分 元 素 。 


»»»alist- [3, 5, 7, 9, 11] 
»»»delalist[:3] 
»»»alist 

[9, 11] 


(ENS 切片 返回 的 是 列表 元 素 的 浅 复制 ,与 列表 对 象 的 直接 赋值 并 不 一 样 。 
例如 : 


»»»aList- [3, 5, 7] 

>>>blist=alist #blist 5j aList 指向 同一 个 内 存 
>>>bList 

| | 

»»»kList[1]-8 

»»»alist 

[3, 8, 7] 

>>>alist ==blist # 两 个 列表 的 值 是 相等 的 
True 

»»»alist is blist # 两 个 列表 是 同一 个 对 象 
True 

»»»id(alist)-- id(pList) # 两 个 列表 的 内 存 地 址 相等 
True 

>>> 

19061816 

>>>aList= [3, 5, 7] 

»»»Hst-alist[::] # 切 片 , 浅 复制 

»»»alist ==bList # 两 个 列表 的 值 相等 


>>>alist is blist # 浅 复制 ,不 是 同一 个 对 象 


>>> id(alist)== id(list) # 了 两 个 列表 对 象 的 地 址 不 相等 
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False 

»»»id(x[0])-- id(y[0]) # 不 要 怀疑 ,相同 值 在 内 存 中 仍然 只 有 一 份 
True 

»»»Hlist[1]-8 # 修 改 brist 列表 元 素 的 值 不 会 影响 alist 
>>>bList Hist 的 值 发 生 改变 

I, 8, 7] 

»»»alist #arist 的 值 没有 发 生 改变 

[3, 5 7] 

>>>aList ==bList 

False 

>>>alist is blist 

False 


顺便 再 补充 一 点 ,虽然 直接 把 一 个 列表 变量 赋值 给 另 一 个 变量 时 两 个 变量 指向 同一 
个 内 存 地 址 ,但 是 把 一 个 列表 分 别 赋值 给 2 个 变量 时 就 不 是 这 样 的 情况 了 ,例如 : 


»»»x-[l, 2, 3] 

>>>Yy [1, 2, 3] 

»»»id(x)--id(y) 

False 

>>> y.append (4) # 修 改 Y 的 值 ,不 影响 x 
>>>x 

IH; 2,3] 
>>>y 

H, 2,3, 4 


然而 , 当 列表 中 包含 其 他 可 变 序 列 时 ,情况 变 得 更 加 复杂 ,例如 : 


>>> [[1], (2), [3]] 

»»»y-x[:] 

>>>y 

[[1], [2]; [3]] 

>>>y[0]= [4] # 直 接 修改 y 中 下 标 为 0 的 元 素 值 ,不 影响 x 

>>>y 

[[4], [2], [3] 

>>> y[1] -append (5) # 通 过 列表 对 象 的 方法 原 地 增加 元 素 ,影响 x 

>>>y 

[[4], [2, 5], [3]] 

>>>x 

IH, [2, 5], [3]] 

估计 有 的 读者 已 经 开始 犯 旱 了 , 深 吸 一 口气 , 别 紧张 ,关键 是 记 住 两 点 : DPython 采 
用 的 是 基于 值 的 内 存 管理 模式 ，@Python 变量 中 并 不 直接 存放 值 ,而 是 存放 值 的 引用 。 
时 刻 记 住 这 两 句 话 ,就 不 太 容 易学 了 。 

您 注意 : 使 用 切片 修改 列表 元 素 值 时 ,如 果 左 侧切 片 是 连续 的 ,那么 等 号 两 侧 的 列 
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表 长 度 可 以 不 一 样 ;如 果 左 侧切 片 不 连续 , 则 右 侧 列表 中 元 素 个 数 必须 与 左 侧 相等 ;使 用 


del 命令 和 切片 删除 列表 中 部 分 元 素 时 ,切片 可 以 不 连续 。 例 如 : 


»»»x-list (range (10)) 

»»»x[:2]- [3,5] # 等 号 两 侧 不 等 长 , 抛 出 异常 
ValueError: attempt to assign sequence of size 2 to extended slice of size 5 
»»»x[:2]- [L 1, 1, 1, 1] # 等 号 两 侧 等 长 ,可 以 执行 
2»5»XxX 

[L 1, 1, 3, 1, 5, 1, 7, 1, 9] 

»»»delx[::2] # 可 以 删除 列表 中 不 连续 的 元 素 
>>>x 


D, 3, 5, 7, 9] 


2.2 元 组 与 生成 器 推导 式 


221 元 组 


元 组 也 是 Python 的 一 个 重要 序列 结构 。 从 形式 上 ,元 组 的 所 有 元 素 放 在 一 对 圆 括 
号 中 ,元 素 之 间 使 用 逗号 分 隔 。 下 面 的 代码 演示 了 创建 元 组 的 方法 : 


»»»x-(,2,3) # 直 接 把 元 组 赋值 给 一 个 变量 
»»»x 

2,3 

>>> type (x) HEH type() 函 数 查看 变量 类 型 
<class 'tuple'» 

>>>x= (3) # 这 和 x=3 是 一 样 的 

>>>x 

3 

>>>x= (3,) # 如 果 元 组 中 只 有 一 个 元 素 ,必须 在 后 面 多 写 一 个 逗号 
>>>x 

(3,) 

»»»x-0 # 空 元 组 

2»2»X 

0 

»»»x-tple() # 空 元 组 

>>>x 

0 

>>> tuple (rang 5)) # 将 其 他 迭代 对 象 转换 为 元 组 


(0, 1, 2, 3, 4) 


元 组 属于 不 可 变 (immutable) 序 列 ,一 旦 创建 ,没有 任何 方法 可 以 修改 元 组 中 元 素 的 
值 ,也 无 法 为 元 组 增加 或 删除 元 素 。 因此 ,元 组 没有 提供 append O .extend() 和 insert() 


等 方法 ,无 法 向 元 组 中 添加 元 素 ;同样 ,元 组 也 没有 remove() 和 pop() 方 法 ,也 不 支持 对 
元 组 元 素 进行 del 操作 ,不 能 从 元 组 中 删除 元 素 , 而 只 能 使 用 del 命令 删除 整个 元 组 。 元 
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组 也 支持 切片 操作 ,但 是 只 能 通过 切片 来 访问 元 组 中 的 元 素 ,而 不 支持 使 用 切片 来 修改 元 


组 中 元 素 的 值 ,也 不 支持 使 用 切片 操作 来 为 元 组 增加 或 删除 元 素 。 从 一 定 程度 上 讲 , 可 以 
认为 元 组 是 轻 量 级 的 列表 ,或 者 “常量 列表 ”。 


一 系列 常量 值 ,主要 用 途 仅 是 对 它们 进行 遍历 或 其 他 类 似 用 途 , 而 不 需要 对 其 元 素 进行 任 
何 修改 ,那么 一 般 建 议 使 用 元 组 而 不 用 列表 。 元 组 在 内 部 实现 上 不 允许 修改 其 元 素 值 ,从 
而 使 得 代码 更 加 安全 ,例如 ,调用 酚 数 时 使 用 元 组 传递 参数 可 以 防止 在 函数 中 修改 元 组 ， 
而 使 用 列表 则 很 难 做 到 这 一 点 。 

另外 ,作为 不 可 变 序列 ,与 整数 .字符 串 一 样 ,元 组 可 用 作 字 典 的 键 ,而 列表 则 永远 都 
不 能 当做 字典 键 使 用 ,也 不 能 作为 集合 中 的 元 素 , 因 为 列表 不 是 不 可 变 的 ,或 者 说 不 可 
哈 希 。 

您 注意 : 虽然 元 组 属于 不 可 变 序 列 , 其 元 素 的 值 是 不 可 改变 的 ,但 是 如 果 元 组 中 包 
DETREI ,情况 就 又 变 得 复杂 了 。 例 如 ,下 面 的 代码 : 


»»»x-(lL, 2], 3) # 包 含 列表 的 元 组 
>>>x[0] [0]=5 # 修 改元 组 中 的 列表 元 素 
>>>x 
([5, 2], 3) 
>>>x[0] .append (8) # 为 元 组 中 的 列表 增加 元 素 
2»»X 
(5, 2, 8], 3) 
»»»x[0]- x[0]* [10] # 试 图 修改 元 组 的 值 ,失败 
Traceback (most recent call last): 

File "< pyshell&83» ", line 1, in «module» 

x[0]- x[0]*- [10] 

TypeError: 'tuple' cbject does not support item assignment 


222 生成 器 推导 式 


从 形式 上 看 ,生成 器 推导 式 与 列表 推导 式 非常 接近 ,只 是 生成 器 推导 式 使 用 圆 括 号 而 
不 是 列表 推导 式 所 使 用 的 方 括号 。 与 列表 推导 式 不 同 的 是 ,生成 器 推导 式 的 结果 是 一 个 


化 为 列表 或 元 组 ,也 可 以 使 用 生成 器 对 象 的 _next__O 〇 方法 或 者 内 置 函数 next() 进 行 遍 
历 ,或 者 直接 将 其 作为 先 代 器 对 象 来 使 用 。 但 是 不 管用 哪 种 方法 访问 其 元 素 , 当 所 有 元 素 


访问 结束 以 后 ,如 果 需 要 重新 访问 其 中 的 元 素 ,必须 重新 创建 该 生成 器 对 象 。 


»»»g- ((i+2)**2 for i in range(10)) # 创 建生 成 器 对 象 

>>>g 

< generator dbject < genexpr» at 0x0000000003095200> 

>>>tuple(g) # 将 生成 器 对 象 转换 为 元 组 
(4, 9, 16, 25, 36, 49, 64, 81, 100, 121) 
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»»»list(g) 
0 
>>>g= ((i+2)**2 for i in range(10)) 
>>>g. next () 
4 
»»»g. mex () 
9 
»»»next(g) 
16 
»»»next(g) 
25 
»»»g-((t2)**2 fori in range(10)) 
>>> for item in g: 
print (item, end- ' ') 
4 9 16 25 36 49 64 81 100 121 


# 生 成 器 对 象 已 遍历 结束 ,没有 元 素 了 


# 使 用 生成 器 对 象 的 ”next _() 方 法 获取 元 素 
# 获 取 下 一 个 元 素 
# 使 用 内 置 函 数 next (获取 生成 器 对 象 中 的 元 素 


# 获 取 下 一 个 元 素 


# 使 用 循环 直接 遍历 生成 器 对 象 中 的 元 素 


的 小 提示 : DA Python 2. x 中 ,生成 器 对 象 用 于 获取 元 素 的 方法 是 next() ,而 不 
是 _next O; 四 生成 器 对 象 具有 情 性 求 值 的 特点 ,只 在 需要 时 返回 元 素 , 比 列表 推导 式 
具有 更 高 的 效率 ,尤其 适合 大 量 数据 的 遍历 。 


象 。 下 面 的 代码 演示 了 如 何 使 用 生成 器 来 生成 斐 波 那 契 数列 。 


>>>def f(): 
a, b-1,1 
while True: 
yielda 
a, b-b, atb 
>>>æf() 
>>> for i in ranæ (10): 
print(a. mext  (), en®' ') 
112358132134 55 
»»»foriinf(): 
if i» 100: 
print(i, end- ' ') 
break 
144 
»»»a-f( 
»»»next(a) 
2 
>>>next (a) 
1 
>>>next(a) 
2 
>>>next (a) 
3 


# 序 列 解 包 , 同 时 为 多 个 元 素 赋值 
# 暂 停 执行 ,需要 时 再 产生 一 个 新 元 素 
# 序 列 解 包 , 继 续 生成 新 元 素 


# 创 建生 成 器 对 象 
# 斐 波 那 契 数 列 中 前 10 个 元 素 


# 斐 波 那 契 数列 中 第 一 个 大 于 100 的 元 素 


# 使 用 内 置 函数 next (0 获取 生成 器 对 象 中 的 元 素 


# 每 次 索取 新 元 素 时 ,由 yield 语 句 生成 
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字典 (dictionary) 是 包含 若干 “ 键 : 值 "元 素 的 无 序 可 变 序列 ,字典 中 的 每 个 元 素 包含 
“ 键 "和 * 值 "两 部 分 ,表示 一 种 映射 或 对 应 关系 ,也 称 为 关联 数组 。 定 义 字 生 【时 ,每 个 元 素 
的 “ 键 "和 * 值 "用 冒号 分 隔 ,不 同 元 素 之 间 用 逗号 分 陋 , 所 有 的 元 素 放 在 一 对 大 括号 *{" 和 
«yn, 

字典 中 的 " 键 "可 以 是 Python 中 任意 不 可 李 数 据 ,如 整数 实数 ,复数 ,字符 中 、 元 组 
等 ,但 不 能 使 用 列表 、 集 合 、 字 典 或 其 他 可 变 类 型 作为 字典 的 * 键 "。 另 外 ,字典 中 的 “ 键 "不 


允许 重复 ,而 “ 值 "是 可 以 重复 的 。 
231 字典 创建 和 元 素 添加 、 修 改 与 删除 
使 用 赋值 运算 符 “二” 将 一 个 字典 赋值 给 一 个 变量 即 可 创建 一 个 字典 变量 。 


>>>a dict- ('server': 'do.diveintopython3.org', 'database': 'mysql'} 
»»»a dict 
('database': 'mysql', 'server': 'do.diveintopython3.org'] 


也 可 以 使 用 内 置 函 数 dict() 通 过 已 有 数据 快速 创建 字典 ， 


>>> keys= ['a', 'b', 'c', 'd'] 

»»»values- [1, 2, 3, 4] 

>>> dictionary- dict (zip (keys, values)) 

»»» print (dictionary) 

pai 1, 'c'::3, "b'e2, 'd's 4E 

»»»x-dict() # 空 字典 
>>>x 

{} 

»»»type(x) # 查 看 对 象 类 型 
«class 'dict'» 

»»»x-( # 空 字典 
>>>x 

üÜ 

»»»type(x) 

«class 'dict'» 


IE T AE JA N BEA A dictO 〇 根据 给 定 的 “ 键 : 值 ”来 创建 字典 


>>>d dict (name- 'Dong', age- 37) 
»»»d 
f'age': 31, name': "Dong'] 


还 可 以 以 给 定 内 容 为 “ 键 ”, 创 建 “ 值 "为 空 的 字典 : 


>>>adict= dict.framkeys (['name', 'age', 'sex'] 
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»»»adict 
('age': None, 'name': None, 'sex': None} 
当 以 指定 “ 键 ? 为 下 标 为 字典 元 素 赋值 时 ,有 两 种 含义 : 四 若 该 " 键 " 存 在 , 则 表示 修改 
该 “ 键 ? 对 应 的 值 ; 四 车 该 键 不 存在 , 则 表示 添加 一 个 新 的 “ 键 : 值 ”, 也 就 是 添加 一 个 新 
元 素 。 
»»»aDict 


('age': 35, 'name': 'Dong', 'sex': 'male') 


»»»aDict['age']- 38 # 修 改元 素 值 
>>>aDict 

('age': 38, 'name': 'Dong', 'sex': 'male') 

>>> aDict ['address"]= 'SDIBT' # 添 加 新 元 素 
>>>aDict 


l'age': 38, 'address': 'SDIBT', 'name': 'Dong', 'sex': 'male') 


使 用 字典 对 象 的 update() 方 法 可 以 将 另 一 个 字典 的 “ 键 : 值 ?一 次 性 全 部 添加 到 当前 
字典 对 象 ,如 果 两 个 字典 中 存在 相同 的 “ 键 ”, 则 以 另 一 个 字典 中 的 “ 值 ” 为 准 对 当前 字典 进 


行 更 新 。 
>>>aDict 
('age': 37, 'score': [98, 97], 'name': 'Dong', 'sex': 'male') 
»»»aDict.items() # 返 回 所 有 元 素 
dict items([('sex', 'male'), ('score', [98, 97]), ('age', 37), ('name', 'Dong')]) 
»»»aDict.update(('a':97, 'age' :39]) # 修 改 'age' 键 的 值 , 同 时 添加 新 元 素 'a':97 
»»»aDict 


('score': [98, 97], 'sex': 'male', 'a': 97, 'age': 39, 'name': 'Dong') 


使 用 del 命令 可 以 删除 整个 字典 ,也 可 以 删除 字典 中 指定 的 元 素 。 例 如 ,继续 上 面 的 


代码 : 
>>> del abict['age'] # 删 除 字典 元 素 
>>>aDict 
{'score': [98, 97], 'sex': 'male', 'a': 97, 'name': 'Dong'} 
»»»delaDict # 删 除 整个 字典 
»»»abict # 字 典 对 象 被 删除 后 不 再 存在 


Traceback (most recent call last): 
File "< pyshell#291> ", line 1, in «module» 
aDict 
NemeError: name 'aDict' is not defined 
也 可 以 使 用 字典 对 象 的 popO II popitem() 方 法 弹出 并 删除 指定 的 元 素 , 例 如 : 
»»»aDict- ('age': 37, 'score': [98, 97], ‘name': 'Dong', 'sex': male'} 
»»»aDict.popitem() # 弹 出 一 个 元 素 , 对 空 字典 会 抛 出 异常 
(age 37) 
»»»aDict.pop('sex') # 弹 出 指定 键 对 应 的 元 素 
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"male' 
»»»aDict 
('score': [98, 97], 'name': 'Dong') 


字典 对 象 的 clear() 方 法 用 于 清空 字典 对 象 中 的 所 有 元 素 ,copy() 方 法 返回 字典 对 象 
的 浅 复制 ,不 再 袭 述 。 


232 访问 字典 对 象 的 数据 


字典 中 的 每 个 元 素 表 示 一 种 映射 关系 或 对 应 关系 ,根据 提供 的 “ 键 " 作 为 下 标 就 可 以 
访问 对 应 的 * 值 ”, 如 果 字 典 中 不 存在 这 个 “ 键 " 会 抛 出 异常 ,例如 : 


>>>aDict= {'age': 37, 'score': [98, 97], ‘name': 'Dong', 'sex': 'male'] 
»»»aDict['age'] HEE 09 "i EE E 3R IDE B "E" 
37 
>>>aDict['address'] HEEE RETE Ah RR 
Traceback (most recent call last): 
File "< pyshell#26 ", line 1, in < module» 
aDict['address'] 
KeyError: 'address' 
>> > assert 'adiress' in aDict, 'Key "address" not in dict" 
Traceback (most. recent. call last): 
File "«pyshellf44» ", line 1, in «module» 
assert 'address' in aDict, 'Key "address" not in dict' 
AssertionError: Key "address" not in dict 
为 了 避免 程序 运行 时 引发 异常 而 导致 崩溃 ,在 使 用 下 标的 方式 访问 字典 元 素 时 ,最 好 
能 配合 条 件 判 断 或 者 异常 处 理 结构 ,例如 : 
»»»aDict- ('age': 37, 'score': [98, 97], 'name': 'Dong', 'sex': 'male'] 
»»»if 'Age' inaDict: # 首 先 判断 字典 中 是 否 存在 指定 的 " 键 " 
print (aDict ['Age']) 
else: 
print('Not Exists.') 


Not Exists. 

»»»try: # 使 用 异常 处 理 结构 
print (aDict ['acdress']) 

except: 
print (Not Exists.") 


Not Exists. 

上 面 的 方法 虽然 能 够 满足 要 求 , 但 是 代码 显得 非常 鹃 唆 , 有 没有 更 好 的 办 法 呢 ? 答案 
是 肯定 的 ,强大 的 Python 怎么 可 能 会 这 人 么 不 人 性 化 呢 。 字 典 对 象 提供 了 一 个 get() 方 法 
用 来 返回 指定 “ 键 " 对 应 的 * 值 ,更 妙 的 是 这 个 方法 允许 指定 该 键 不 存在 时 返回 特定 的 


60 Ó Python 可 以 这 样 学 


s 
“ 值 ”。 例 如 : 
»»»aDict.get ('age') SIR SEI rp fe fe V nie n, RU E IRE Iz hg "(Bn 
37 
»»»aDict.get('address', 'Not Fxists. ') HEE RER F EE In] 48 E RAE 
"Not Exists. ' 
>>>aDict 


('age': 37, 'score': [98, 97], 'name': 'Dong', 'sex': 'male'} 


字典 对 象 的 setdefault() 方 法 用 于 返回 指定 “ 键 " 对 应 的 “ 值 ”, 如 果 字典 中 不 存在 该 


“ 键 ”, 就 添加 一 个 新 元 素 并 设置 该 “ 键 ” 对 应 的 “ 值 ”, 例 如 : 


>>>aDict.setdefault ('address', 'SDIBT') # 增 加 新 元 素 

"SDIBI" 

»»»aDict 

('age': 37, 'soore': [98, 97], 'name': 'Dong', 'address': 'SDIBT', 'sex': 'male'] 


最 后 , 当 对 字典 对 象 进行 迭代 时 ,默认 是 遍历 字典 的 “ 键 ”, 这 一 点 必须 清醒 地 记 在 脑 


子 里 。 当 然 , 可 以 使 用 字典 对 象 的 items() 方 法 返回 字典 中 的 元 素 , 即 所 有 ”* 键 : 值 " 对 , 字 
典 对 象 的 keys() 方 法 返回 所 有 "“ 键 ”,values() 方 法 返回 所 有 “ 值 ”"。 例 如 : 


»»»aDict- ('age': 37, 'score': [98, 97], 'name': 'Dong', 'sex': 'male') 
>> > for item in aDict: # 默 认 遍 历 字典 的 " 键 " 
print (item) 


Score 

age 

sex 

name 

>>> for item in aDict.items(): # 明 确 指 定 遍 历 字 典 的 元 素 
print (item) 


('score', [98, 97]) 

("age', 37) 

('sex', 'male') 

(name, 'Dong') 

»»»aDict.items() 

dict items([('age', 37), ('score', [98, 97]), ('name', 'Dong'), ('sex', 'male')]) 
»»»aDict.keys ) 

dict keys(['age', 'score', 'name', 'sex']) 

»»»aDict.values() 

dict values([37, [98, 97], 'Dong', 'male']) 


AMER: 内 置 函数 lenO ,maxO , min O , sum O 、sorted() 以 及 成 员 测 试 运算 符 


in 也 适用 于 字典 对 象 ,但 默认 是 作用 于 字典 的 “ 键 "。 若 想 作用 于 元 素 , 即 “ 键 : 值 ?对 , 则 
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需要 使 用 字典 对 象 的 items() 方 法 明确 指定 ; 若 想 作用 于 “ 值 ”, 则 需要 使 用 values O 9] A 
指定 。 


233 案例 精 选 


统计 分 析 在 很 多 领域 都 有 重要 用 途 , 如 密码 破解 .图像 直方 图 等 。 下 面 的 代码 首先 生 
成 包含 1000 个 随机 字符 的 字符 串 ,然后 统计 每 个 字符 的 出 现 次 数 。 


>>> import string 

>>> inport randm 

»»»x-string.ascii letterst string.digits* string.punctuation 

>>>x 

'abodefghijklmoparstuvwxyzABCDEFGHIJKLMNOEORSTUVWAYZ0123456769 "FS SE\' () * +,- ./:;<=>?@ [NN]^ 7 
ür-* 

»»»y- [randm.choice(x)for i in range(1000)] # 生 成 包含 1000 个 随机 字符 的 列表 


»»»z-''.join(y) # 把 列表 中 的 字符 连接 成 为 字符 串 
»»»d-dict() # 空 字典 
>>> for dh in z: 

d[ch]- d.get (ch, 0)+1 # 修 改 每 个 字符 的 频次 


也 可 以 使 用 collections 模块 的 defaultdict 类 来 实现 该 功能 。 


>> > import string 
>>> inport randcm 
»»»x-string.ascii letters* string.digits* string.punctuation 
>>> y= [randm.choioce(x)for i in range (1000) ] 
»»»z-''.join(y) 
>>> fram collections import defaultdict 
> > > frequences- defaultdict (int) # 所 有 值 默 认为 0 
>>> fregquences 
defaultdict(« class 'int'», ()) 
>>> for item in z: 
frequences[item] 4-1 # 修 改 每 个 字符 的 频次 
>>> freguences.items() 


使 用 collections 模块 的 Counter 类 可 以 快速 实现 这 个 功能 ,并 且 能 够 满足 其 他 需要 ， 
例如 ,查找 出 现 次 数 最 多 的 元 素 。 下 面 的 代码 演示 了 Counter 类 的 用 法 : 


>>> fram collecticns import Counter 


>> > frequences- Counter (z) # 这 里 的 = 还 是 前 面 代码 中 的 字符 串 对 象 
>>> frequenoes. items () 

>>> frequenoes.most common (1) # 返 回 出 现 次 数 最 多 的 1 个 字符 及 其 频率 
>> > frequences.most cammn (3) # 返 回 出 现 次 数 最 多 的 前 3 个 字符 及 其 频率 


(QARAR: 内 置 函 数 globals() 和 locals() 分 别 返回 包含 当前 作用 域内 所 有 全 局 
变量 和 局 部 变量 的 名 称 及 值 的 字典 。 例 如 : 
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s 
»»»a-(U, 2,3, 4, 5) # 全 局 变量 
»»»b- Hello world." # 全 局 变量 
>>> def dem(): 
a-3 # 局 部 变量 
b- (1, 2, 3] # 局 部 变量 


print('locals:', locals()) 

print ('glcbals:', glcbals()) 
>>>dem() 
locals: ('a': 3, b': [1, 2, 3]) 
glcbals: {'a': (l, 2, 3, 4, 5), "b': 'Helloworld.', ' builtins ':«modde'  builtin — '(puilt- in) 
>, 'dem': «function demo at Ox013907F0» , '__package__': None, ' mam ':' main ',' doc 
': None) 


(QARAMA: 有 序 字典 。Python 内 置 字典 是 无 序 的 ,如 果 需 要 一 个 可 以 记 住 元 素 
插入 顺序 的 字典 ,可 以 使 用 collections. OrderedDict。 例 如 : 


>>> inport collections 

»»» x- collections.OrderedDict () # 有 序 字典 
»»»x['a']-3 

»»»x['b']-5 

»»»x['c']-8 

2»5»X 

Orderecbict ([('a', 3), ('b', 5), ('c*, 81) 


(QARAR: 内 置 函 数 sorted() 可 以 对 字典 元 素 进行 排序 并 返回 新 列表 ,充分 利用 
key 参数 可 以 实现 丰富 的 排序 功能 。 例 如 : 


>> > phonebook= ('Linda':'7750', 'Bcb':'9345', 'Carol':'5834') 
>>> frm operator import itemgetter 


> > > sorted (phonebook. items (), key- itemgetter (1)) # 按 字典 的 " 值 "进行 排序 
[('Carol", '5834*), ("Linda', '7750'), ("Bb', '9345')] 
>>> sorted(phonebook.items(), key- itemgetter(0)) # 按 字典 的 " 键 "进行 排序 


[('"Bab'，'9345")，("Carol'，'5834") ('Linda', '7750")] 
»»»sorted(phonsbook.items(), key- lambda item:item[0]) $ECEJUÉU "iE ETT HE 
[(*Bab', '9345'), ('Carol', '5834'), ('Linda', '7750')] 
»»»persons- [ ('name':'Dong', 'age':37), 
{'name" :"Zhang', 'age':40), 
(name! :'Li', 'age':50), 
(name! : 'Dong', 'age' :43)] 
»»» print (persons) 
[{'age': 37, "name: 'Dong'}, ('age': 40, 'name': 'Zhang'), ('age': 50, 'name': 'Li'), ('age': 43, 'name': 
'Dong')] 
# 使 用 key 来 指定 排序 依据 , 先 按 姓名 升序 排序 ,姓名 相同 的 按 年 龄 降序 排序 
# 注 意 ,在 某 一 项 前 面 加 负 号 表示 降序 排序 ,这 一 点 只 适用 于 数字 类 型 ,不 通用 
»»»print(sorted(persons, key- lambda x: (x['name'], -x['age']))) 
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[fage': 43, 'name': "Dong'], ('age': 37, "name': "Dong'), ('age': 50, mame': "Li'), ('age': 40, "name: " 
Zheng! )] 


(QARAR: Python 支持 字典 推导 式 快速 生成 符合 特定 条 件 的 字典 。 


>>> {i:str(i)for i in range(1, 5)} 
i 
»»»x-['A', B, 'C', 'D'] 

22» y-['a', 'b', 'b', 'd'] 

>>> {i:j for i,j in zip(x,y)) 

[A's "a^, "ers b, 'B': Cb', "D': 'd'} 


2.4 集 合 


241 集合 基础 知识 


集合 是 无 序 可 变 序列 ,使 用 一 对 大 括号 (作者 温 志 提示 。 这 一 点 和 字典 很 类 似 , 千 万 
不 要 搞 混 啊 ) 作 为 界定 符 ,元 素 之 间 使 用 豆 号 分 隔 ,同一 个 集合 内 的 每 个 元 素 都 是 唯一 的 ， 
元 素 之 间 不 允许 重复 。 


在 Python 中 ,直接 将 集合 赋值 给 变量 即 可 创建 一 个 集合 对 象 。 


»»»a-(3, 5) # 创 建 集合 对 象 
>>>a 

{3, 5) 

»»»type(a) # 查 看 对 象 类 型 
<class 'set'» 


也 可 以 使 用 set() 函数 将 列表 、 元 组 等 其 他 可 迁 代 对 象 转 换 为 集合 ,如 果 原 来 的 数据 
中 存在 重复 元 素 , 则 在 转换 为 集合 的 时 候 只 保留 一 


»»»a set-set(range (8, 14)) HE range 对 象 转换 为 集合 
»»»a set 

(8, 9, 10, 11, 12, 13) 

»»»b set- set ([0, 1, 2, 3, 0, 1, 2, 3, 7, 8]) # 转 换 时 自动 去 掉 重 复元 素 
>>>b set 

10,1,2, 3, 7, 8 

»»»x-set(Ü # 空 集合 

>>>x 


ü 


当 不 再 使 用 某 个 集合 时 ,可 以 使 用 del 命令 删除 整个 集合 。 
T adi ad id 、 字 符 串 .元 组 等 不 可 变 类 型 (或 者 说 可 哈 希 ) 的 数据 ， 


Edda, LX EE X HAEIECAR bashO BA HA JE 常 ) 的 对 象 都 不 能 作 


64 外 Python 可 以 这 样 学 
P d 


为 集合 的 元 素 , 也 不 能 作为 字典 对 象 的 “ 键 "。 

(QARMA: 字典 和 集合 的 in 操作 比 列表 快 很 多 。 相 信 各 位 读者 也 能 有 这 样 的 体 
验 ,一 个 功能 可 以 使 用 多 种 方法 实现 ,也 可 以 采用 不 同 的 数据 类 型 实现 。 如 果 仔细 分 析 比 
较 一 下 会 发 现 ,不 同 数 据 类 型 之 间 某 些 操作 的 效率 相差 还 是 很 大 的 ,在 选用 时 应 多 加 注 
意 ,因为 不 同 的 选择 意味 着 不 同 的 速度 和 效率 。 例 如 ,由 于 Python 字典 和 集合 都 使 用 
hash 表 来 存储 元 素 ,因此 元 素 查找 操作 的 速度 非常 快 ,这 就 直接 决定 了 关键 字 in 作用 于 
字典 和 集合 时 比 作用 于 列表 要 快 得 多 。 


import randam 

import time 

x= list (range (10000) ) # 生 成 列表 
y= set (range (10000) ) # 生 成 集合 
z- dict (zip (range (1000) , range (10000) ) ) # 生 成 字典 
r= randm.randint (0, 9999) # 生 成 随机 数 


start- time.time() 
for i in range (9999999) : 

rinx # 测 试 列表 中 是 否 包含 某 个 元 素 
print('list,time used:', time.time()- start) 


start- time.time() 
for i in range (9999999) : 
riny # 测 试 集合 中 是 否 包含 某 个 元 素 


print('set,time used:', time.time()- start) 


start- time.time() 
for i in range (9999999) : 
rinz # 测 试 字典 中 是 否 包含 某 个 元 素 

print ('dict, time used:', time.time()- start) 

上 面 的 代码 运行 结果 如 下 ,对 于 成 员 测试 运算 符 in, 列 表 的 效率 远 远 不 如 字典 和 集 
合 ,差距 简直 太 惊 人 了 。 大 家 修改 一 下 上 面 代码 中 列表 、 字 典 和 集合 的 长 度 会 发 现 , 随 着 
序列 的 变 长 ,列表 的 速度 越 来 越 慢 ,而 字典 和 集合 基本 上 不 受 影响 。 

list,time used: 889.4648745059967 

set,time used: 1.5110864639282227 

dict,time used: 1.0640606880187988 


22 集合 操作 与 运算 
1. 集合 元 素 增加 与 删除 
使 用 集合 对 象 的 add() 方 法 可 以 为 其 增加 新 元 素 ,如 果 该 元 素 已 存在 于 集合 则 忽略 
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该 操作 ;update() 方 法 用 于 合并 另外 一 个 集合 中 的 元 素 到 当前 集合 中 。 例 如 : 


>>>s={1, 2, 3} 

>>>s.add(3) # 添 加 元 素 ,重复 元 素 自动 忽略 
>>>5s 

{1, 2, 3} 

»»» s.update((3,4)) # 更 新 当前 集合 ,自动 忽略 重复 的 元 素 


>>>s 


{1, 2, 3, 4) 


集合 对 象 的 pop() 方 法 用 于 随机 删除 并 返回 集合 中 的 一 个 元 素 , 如 果 集 合 为 空 则 抛 
出 异常 ;remove() 方 法 用 于 删除 集合 中 的 元 素 ,如 果 指 定 元 素 不 存在 则 抛 出 异常 ;discard 
O 〇 用 于 从 集合 中 删除 一 个 特定 元 素 ,如 果 元 素 不 在 集合 中 则 忽略 该 操作 ;clear() 方 法 清 
空 集合 删除 所 有 元 素 。 例 如 : 


>>> s.discard(5) # 删 除 元 素 ,不 存在 则 忽略 该 操作 
>>>s 

{1, 2, 3, 4) 

>>> s.remove (5) # 删 除 元 素 ,不 存在 就 抛 出 异常 


Traceback (most. recent call last): 
File "«pyshellf425» ", line 1, in «module» 
s.remove (5) 
KeyError: 5 
>>> s.pp() BERE BI — 1 763€ 
1 


2. 集合 运算 
Python 集合 支持 交集 、 并 集 、 差 集 等 运算 ,例如 : 


»»»a set- set ([8, 9, 10, 11, 12, 13]) 
»»»b set- (0, 1, 2, 3, 7, 8} 


»»»a set | b set # 并 集 
(0, 1, 2, 3, 7, 8, 9, 10, 11, 22, 13) 

»»»a set.union(b set) Dra 
10, 1, 2, 3, 7, 8, 9, 10, 11, 12, 13) 

»»»a st &b set # 交 集 
(8) 

»»»a set.intersection(b set) # 交 集 
{8} 

>>>a set.differenoe(b set) # 差 集 


{9, 10, 11, 12, 13} 
>>>a set-b set 
19, 10, 11, 12, 13) 
»»»a set.symetric difference(b set) # 对 称 差 集 
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10, 1, 2, 3, 7, 9, 10, 11, 12, 13) 
>>>a set^b set 

10, 1, 2, 3, 71, 9, 10, 11, 12, 13} 

»»»x-(ü,2,3! 

»»»y-ll 2, 5) 

»»»z-(1,2,3,4] 

»»»xy # 比 较 集合 大 小 


>>>x<z 


>>>xz 
False 

>>>x.issubset (y) # 测 试 是 否 为 子 集 
False 

»»»x.issubset(z) 

True 


AMER: 内 置 函数 lenO ,maxO , min O ,sum O 、sorted() 以 及 成 员 测试 运算 符 
in 也 适用 于 集合 。 

您 注意 : 关系 运算 符 二 一、 去 、 志 一 作用 于 集合 时 表示 集合 之 间 的 包含 关系 ,而 
不 是 集合 中 元 素 的 大 小 关系 。 HEBER AP DARE 全 昌 不成立 ,不 代表 NZD 

(QARAR: 自 定义 枚 举 类 型 。 除 了 本 章 介绍 的 常用 数据 类 型 ,Python 还 通过 
collections , enum \array ,heapq fractions 等 标准 库 提供 了 其 他 丰富 的 类 型 ,这 里 简单 介绍 
如 何 使 用 enum 模块 提供 的 Enum 类 来 创建 枚 举 类 型 ,其 他 标准 库 将 在 后 续 章 节 中 根据 
内 容 的 组 织 逐 步 进行 介绍 。 


>>> fran enum import Enum # 导 入 模块 中 的 类 
>>> class Color (Enum) : # 创 建 自 定义 枚 举 类 
red-1 
blue-2 
green- 3 
»»»Color.red # 访 问 枚 举 类 的 成 员 
<Color.red: 1» 
>>> type (Color.green) # 查 看 枚 举 类 成 员 的 类 型 


«enum 'Color'» 

>>> isinstance (Color.red, Color) 

Tre 

»»»x-dict() 

»»» x[Color.red]- 'red' # 枚 举 类 成 员 可 以 哈 希 ,可 以 作为 字典 的 " 键 " 
>>>x 

{< Color.red: D»: 'red') 

»»»Oolor(2) # 返 回 指定 值 对 应 的 枚 举 类 成 员 
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»»»r.value 

1 

>>> list (Color) # 枚 举 类 是 可 以 迭代 的 
[<Color.red: 1>, <Color.blue: 2» , <Color.green: Ð] 


243 案例 精 选 
作为 集合 的 具体 应 用 ,可 以 使 用 集合 快速 提取 序列 中 单一 元 素 , 即 提取 出 序列 中 所 有 


不 重复 元 素 。 如 果 使 用 传统 方式 ,需要 编写 下 面 的 代码 ; 


>> > import randcm 
# 生 成 100 个 介 于 0~ 9999 之 间 的 随机 数 
>>> listRandom= [randcm.choice (range (10000) ) for i in range(100)] 
>> > naRepeat= [] 
>>> for i in listRandm : 

if i not in ncRepeat : 

noRepeat .append (i) 

>>> len(listRandcm) 
>>> len (noRepeat) 


而 如 果 使 用 集合 ,只 需要 下 面 这 么 一 行 代码 就 可 以 了 ,可 以 参考 上 面 的 代码 对 结果 进 
行 验证 。 
> > > newSet= set (listRandam) 


这 里 再 给 一 个 例子 ,下 面 的 代码 用 于 返回 指定 范围 内 一 定数 量 的 不 重复 数字 ,使 用 集合 的 
效率 明显 优 于 使 用 列表 。 

import random 

import time 


def RandcnNunibers] (number, start, end) : 
"bil HH doe ^E DX, nmber 个 介 于 start 和 end 之 间 的 不 重复 随机 数 '… 
data- [] 
while True: 
element- randan.randint (start, end) 
if element not in data: 
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data.append (element) 
if len(data)-— number: 
break 
return data 


def RandamNumbers? (number, start, end): 

"使 用 集合 来 生成 nmber 个 介 于 start 和 end 之 间 的 不 重复 随机 数 '… 
data- set() 
while True: 

element- randan.randint (start, end) 

data.acd (element) 

if len(data)- - number: 

return data 


start- time.time() 
for i in range (10000) : 

di- RandamNunbersl(500, 1, 10000) 
print('Time used:', time.time()- start) 


start- time.time() 
for i in range (10000) : 

d2- RandaniNunbers2 (500, 1, 10000) 
print('Time used:', time.time()- start) 
运行 结果 为 


Time used: 41.77738952636719 
Time used: 13.330762386322021 


上 面 的 代码 只 是 为 了 展示 Python 获取 不 重复 元 素 的 原理 ,如 果 在 项 目 中 需要 这 样 
一 个 功能 时 ,还 是 直接 使 用 下 面 的 方法 更 好 一 些 ,random 模块 的 sample() 方 法 可 以 直接 
从 指定 序列 中 选取 指定 数量 个 不 重复 的 元 素 。 

>>> inport randcm 


>>> randam.sample (range (1000), 20) 
[61, 538, 873, 815, 708, 609, 995, 64, 7, 719, 922, 859, 807, 464, 789, 651, 31, 702, 504, 25] 


EBE 我 给 学 生 讲 这 段 代码 的 时 候 , 有 同学 修改 参数 进行 调用 , 例如 
RandomNumbers2(500, 1, 100) ,结果 寻 致 死 循 环 。 你 能 想到 原因 吗 ? 

(以 拓展 知识 ， Python 也 支持 集合 推导 式 。 集 合 推导 式 是 什么 ? 请 看 下 面 的 代码 : 

>>> {x.strip()forxin(' he ','se  ',' 19) 

{'I', 'she', 'he'} 


>>> inport random 
>>> {randm.randint (1,500) for i in range (100) } 
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# 生 成 随机 数 ,自动 去 除 重 复元 素 
»»»1len() # 一 般 而 言 输出 结果 会 小 于 100 
>>> {str(x)for x in range (10)} 
(3*, "05, GT t", rat, nt "5°, 16", 19', mn) 


2.5 序列 解 包 


在 实际 开发 中 ,序列 解 包 是 非常 重要 和 常用 的 一 个 功能 ,可 以 使 用 非常 简洁 的 形式 完 
成 复杂 的 功能 ,大 幅度 提高 了 代码 的 可 读 性 ,并 且 减 少 了 程序 员 的 代码 输入 量 。 例 如 ,可 
以 使 用 序列 解 包 功能 对 多 个 变量 同时 进行 赋值 ,下面 都 是 合法 的 Python 赋值 方法 。 


>>>z Y, 7l, 2, 3 # 多 个 变量 同时 赋值 

»»»v tuple = (False, 3.5, 'exp') 

>>> (X y, z)- v tuple 

»»»X,y,z-v tuple 

»»»x, y, z= range(3) # 可 以 使 用 range 对 象 进行 序列 解 包 
>>>x, y, z-mep(str, range(3)) # 使 用 迭代 对 象 进行 序列 解 包 


序列 解 包 也 可 以 用 于 列表 和 字典 ,但 是 对 字典 使 用 时 ,默认 是 对 字典 * 键 "进行 操作 ， 
如 果 需 要 对 * 键 : 值 "对 进行 操作 ,需要 使 用 字典 的 items() 方 法 说 明 ,如 果 需 要 对 字典 “ 值 ” 
进行 操作 , 则 需要 使 用 字典 的 values() 方 法 明确 指定 。 下 面 的 代码 演示 了 列表 与 字典 的 
序列 解 包 操作 ; 


»»»e [1, 2, 3] 


>>>b, c, d-a # 列 表 也 支持 序列 解 包 的 用 法 
>>>b 

1 

>>>x, y, 2 sorted([1, 3, 2]) #sorted() 函 数 返回 排序 后 的 列表 


>>> {'a':1, 'b':2, 'c':3) 
>>>b, c, d- s.items() 


>>>b # 这 里 的 结果 如 果 和 你 的 不 一 样 是 正常 的 
Cet, 3) 

>>>b, c, Œs # 使 用 字典 时 不 用 太 多 考虑 元 素 的 顺序 
>>>b # 多 执行 几 次 试 一 试 ,或 许 结果 会 有 变化 


sea 
>>>b, c, d- s.values() 
»»»print(b, c, d) 
132 


使 用 序列 解 包 可 以 很 方便 地 同时 遍历 多 个 序列 。 


>>> Jeys= ['a', 'b', 'c', 'd"] 

>>>values= [1, 2, 3, 4] 

>>> for k, v in zip(keys, values): 
print(k, v) 


70 $ Python 可 以 这 样 学 


s 


al 
b2 
e3 
d4 


FARER T XT P3 BEER C enumerate() 返 回 的 迭代 对 象 进 行 遍历 时 序列 解 包 的 


用 法 : 


»»»x-['a', 'b', 'c'] 
>>> for i, vinenmerate(x) : 
print ('The value on position (0) is (1)' .format (i,v)) 
The value on position 0 isa 
The value on position lis b 
The value on position 2 is c 


下 面 对 字 典 的 操作 也 使 用 到 序列 解 包 : 


2»»s-(['a':l, 'b':2, 'c':3) 

>>> for k, vins.items(): Vg tp 094) 203€ "BEA "E RIR 
print (k, v) 

al 

c3 

b2 


另外 ,序列 解 包 还 支持 下 面 的 用 法 : 


»»»print(* [1, 2, 3], 4, * (5, ©) 
123456 

>>> # range (4),4 

(0, 1, 2, 3, 4) 

»»»(* range(4), 4, * (5, 6, 7)) 
{0, 1, 2, 3, 4, 5, 6, 7) 
2»»(x'l,**("y': 2H 

i wear 


ANER: 序列 解 包 的 有 些 用 法 在 低 版 本 的 Python 中 不 支持 ; 四 在 调用 函数 


时 ,在 实 参 前 面 加 上 一 个 星 号 ( * ) 也 可 以 进行 序列 解 包 , 从 而 实现 将 序列 中 的 元 素 值 依次 
传递 给 相同 数量 的 形 参 , 详 见 3.3 节 。 
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3.1 选择 结构 


生活 中 处 处 充满 了 选择 : 如 果 周 末 不 下 雨 我 就 约 朋友 去 爬山 ,否则 就 去 教学 楼 大 厅 
里 打 太极 拳 ;如 果 某 个 同学 平时 学 习 很 认真 但 是 期 末 考 试 前 确实 因为 临时 有 事 耽 误 了 复 
习 而 没有 考 好 ,只 要 差 得 不 太 多 我 也 一 样 给 打 及 格 ; 去 市 场 买 菜 的 时 候 比较 一 下 , 哪 家 的 
菜 又 好 又 便宜 就 买 哪 家 的 ;诸如 此 类 ,我 们 时 刻 都 在 根据 实际 条 件 做 出 这 样 或 那样 的 选 
择 。 编 写 程序 也 是 如 此 , 当 某 个 条 件 得 到 满足 时 就 去 做 特定 的 事情 ,否则 就 做 另 一 件 事 
情 , 这 就 是 选择 结构 。 
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在 选择 结构 和 循环 结构 中 ,都 要 根据 条 件 表达 式 的 值 来 确定 下 一 步 的 执行 流程 。 条 


件 表达 式 的 值 只 要 不 是 False、0( 或 0.0.0j 等 ) 空 值 None. 空 列表 、 空 元 组 . 空 集合 、 空 字 
典 , 空 字符 串 、 空 range 对 象 或 其 他 空 迭 代 对 象 ,Python 解释 器 均 认为 与 True 等 价 。 从 
这 个 意义 上 来 讲 , 所 有 的 Python 合法 表达 式 都 可 以 作为 条 件 表达 式 ,包括 含有 丽 数 调用 


的 表达 式 。 例 如 : 


>>>if 3: # 使 用 整数 作为 条 件 表达 式 
Print (5) 

5 

»»»a [2,3] 

»»»ifa: # 使 用 列表 作为 条 件 表达 式 
print (a) 

[1, 2, 3] 

»»»ell 

>>>ifa: 
print (a) 

else: 
print ('empty') 

empty 

»»»i-s-0 


»»»while i «-10: # 使 用 关系 表达 式 作为 条 件 表达 式 
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st-i 
i+=1 

»»»print(s) 

55 

»»»i-s-0 

>>>while True: # 使 用 常量 True 作 为 条 件 表达 式 


st-i 
if i»10: # 符 合 特定 条 件 时 使 用 break 语 句 退出 循环 


»»»print(s) 

55 

>>> 0 

>>> for i in range(0, ll, 1): # 饥 历 序列 元 素 
st-i 

»»»print(s) 

55 


关于 表达 式 和 运算 符 的 详细 内 容 在 1. 3. 3 节 中 已 有 介绍 ,这 里 不 再 袭 述 ,只 重点 介绍 
一 下 比较 特殊 的 几 个 运算 符 。 首 先是 关系 运算 符 , 与 很 多 语言 不 同 的 是 ,在 Python 中 的 
关系 运算 符 可 以 连续 使 用 ,例如 : 


>>>print (1<2<3) 
True 
>>>print(K 23) 
False 
>>>print (1< 32) 
True 


在 Python 中 ,条 件 表达 式 中 不 允许 使 用 赋值 运算 符 "二 ”避免 了 其 他 语言 中 误 将 关 
系 运算 符 “ 二 二 ”写作 赋值 运算 符 “==” 带 来 的 麻烦 ,例如 ,下 面 的 代码 在 条 件 表达 式 中 使 用 
赋值 运算 符 “==” 将 抛 出 异常 ,提示 语法 错误 。 

»»»ifa-3: # 条 件 表达 式 中 不 允许 使 用 赋值 运算 符 

SyntaxError: invalid syntax 

»»»if(a-3)and(bp- 4): 

SyntaxError: invalid syntax 

比较 特殊 的 运算 符 还 有 膛 辑 运算 符 and 和 or XP ANE AERA EROR cC GR 
式 1 and 表达 式 2" 而 言 , 如 果 * 表 达 式 1 的 值 为 False 或 其 他 等 价值 时 ,不 论 * 表 达 式 2” 
的 值 是 什么 ,整个 表达 式 的 值 都 是 False, 此 时 “表达 式 2” 的 值 无 论 是 什么 都 不 影响 整个 
表达 式 的 值 ,因此 将 不 会 被 计算 ,从 而 减少 不 必要 的 计算 和 判断 。 另 外 ,Python 中 的 逻辑 
运算 符 在 某 些 方面 和 其 他 语言 也 有 所 不 同 , 例 如: 
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下 面 的 函数 使 用 指定 的 分 隔 符 把 多 个 字符 串 连接 成 一 个 字符 串 , 如 果 用 户 没 有 指定 
分 隔 符 则 使 用 逗号 。 


>>> def Join(cList, sep- None): 
return(sep or ', ') .join (chList) # 注 意 :参数 sep 不 是 字符 串 时 会 抛 出 异常 
She [2 3 5 
>>> Join (chest) 
11,2,3,4,5' 
>>>Join(chTest, ':') 
11:2:3:4:5" 
>>> Join(chTest, ' ') 
12345! 


当然 ,也 可 以 把 上 面 的 函数 直接 定义 为 下 面 带 有 默认 值 参数 的 形式 : 


>>> def Join(diList, sep- ',"): 
return sep.join (chList) 


败 的 概率 ,并 将 多 个 条 件 根据 and de or 运算 符 的 短路 求 值 特性 来 组 织 顺序 ,可 以 大 幅度 
提高 程序 运行 效率 ,减少 不 必要 的 计算 ,这 也 属于 代码 优化 的 内 容 。 

(QARAR: 运 辑 运算 符 与 常见 电路 连接 方式 的 相似 之 处 。 大 家 应 该 都 学 过 高 中 
物理 ,还 记得 并 联 电路 、 串 联 电路 、 短 路 这 样 的 概念 吗 ? 可 以 做 个 简单 类 比 ,or 运算 符 类 
似 于 并 联 电路 ,只 要 有 一 个 开关 是 通 的 那么 灯 就 是 亮 的 ;and 运算 符 类 似 于 串联 电路 , 必 
须 所 有 开关 是 通 的 那么 灯 才 是 亮 的 ;not 运算 符 类 似 于 短路 电路 ,如 果 开 关 通 了 那么 灯 就 
灭 了 ,如 图 3-1 所 示 。 


312 选择 结构 的 几 种 形式 


选择 结构 通过 判断 某 些 特定 条 件 是 否 满足 来 决定 下 一 步 的 执行 流程 ,是 非常 重要 的 
控制 结构 。 常 见 的 有 单 分 支 选择 结构 、 双 分 支 选 择 结构 多 分 支 选 择 结构 以 及 嵌 套 的 分 支 
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s, 
Ee ë [9t D+ 
K 
ks KI \K2 F T 
Kl. K2 
(a) 并 联 电路 (b) 串联 电路 (c) 短路 


图 3-1 逻辑 运算 符 与 几 种 电路 的 类 比 关系 


结构 ,形式 比较 灵活 多 变 , 具 体 使 用 哪 一 种 最 终 还 是 取决 于 要 实现 的 业务 好 辑 。 循 环 结构 
和 异常 处 理 结构 中 也 可 以 带 有 else 子 句 ,也 可 以 看 作 是 特殊 形式 的 选择 结构 。 


1. 单 分 支 选择 结构 


单 分 支 选 择 结构 是 最 简单 的 一 种 形式 ,其 语法 如 下 所 示 ,其 中 表达 式 后 面 的 冒号 “: 
是 不 可 缺少 的 ,表示 一 个 语句 块 的 开始 ,后 面 几 种 其 他 形式 的 选择 结构 和 循环 结构 中 的 冒 
号 也 是 必须 要 有 的 。 | 


证 表达 式 : 
语句 块 条 件 表达 式 是 否 成 立 ? 
是 


当 表达 式 值 为 True 或 其 他 等 价值 时 ,表示 条 件 满 
足 , 语 句 块 将 被 执行 ,否则 该 语句 块 将 不 被 执行 ,继续 
执行 后 面 的 代码 (如 果 有 ) ,如 图 3-2 所 示 。 

下 面 的 代码 简单 演示 了 单 分 支 选 择 结构 的 用 法 : 


x- input ('Input two numbers: ') 图 3-2 单 分 支 选 择 结构 
a, b-map(int, x.split()) 
if a»b: 
a,b-b,a # 序 列 解 包 ,交换 两 个 变量 的 值 
print (a, b) 


是 i DOE 3 I-II E TARAFINI. 而 实际 上 ,只 要 遵 
循 一 定 的 约定 ,Python 代码 的 排版 是 可 以 降低 要 求 的 ,例如 下 面 的 代码 : 


»»»if d2: print ('ok!) # 如 果 语 句 较 短 ,可 以 直接 写 在 分 支 语句 后 面 
ok 
>>> if True:print (3) ;print (5) # 在 一 行 写 多 个 语句 ,使 用 分 号 分 隔 


3 
5 


XS 小 提示 : 在 上 面 代码 中 ,“a, b— b. a” 是 Python 序列 解 包 的 用 法 ,用 来 交换 两 个 
变量 的 值 ,等 价 于 C 语言 的 如 下 3 条 代码 (假设 变量 已 经 声明 并 且 类 型 正确 ) ,关于 序列 
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解 包 更 多 内 容 请 参考 2.5 节 。 


2. 双 分 支 选择 结构 
双 分 支 选择 结构 的 语法 为 
if 表 达 式 : 

语句 块 1 
else: 
语句 块 2 

当 表达 式 值 为 True 或 其 他 等 价值 时 ,执行 语句 块 1, 否 则 执行 语句 块 2, 如 图 3-3 
Bim o 


3-3 ” 双 分 支 选择 结构 


下 面 的 代码 演示 了 双 分 支 选择 结构 的 用 法 : 
»»»diest- ['1*, '2*, '3*, '4', '5'] 
>>>if dTest: 
print (chest) 
else: 
print ("Espty") 
pr, "2^, "3^ t, 5n] 
(QARAR: Python 还 提供 了 一 个 三 元 运算 符 , 可 以 实现 与 选择 结构 相似 的 效果 。 
当 条 件 表达 式 condition 的 值 与 True 等 价 时 ,表达 式 的 值 为 valuel ,否则 表达 式 的 值 
为 value2。 另 外 ,valuel 和 value? 本 身 也 可 以 是 复杂 表达 式 , 也 可 以 包含 函数 调用 。 下 
面 的 代码 演示 了 上 面 的 表达 式 的 用 法 ,可 以 看 出 ,这 个 结构 的 表达 式 也 具有 惰性 求 值 的 
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s 


»»»8a-5 
»»»print(6)if a» 3 else print (5) 
6 


»»»print(6 if a» 3 else 5) # 注 意 , 虽 然 结果 与 上 一 行 代码 一 样 , 但 代码 含义 不 同 
6 

»»»b-6ifa»13else9 # 赋 值 运 算 符 优先 级 低 

>>>b 


9 
»»»x-math.sqrt (9) if 5» 3 else randam.randint (1, 100) 
# 此 时 还 没有 导入 mth BUR 
Traceback (most. recent. call last): 
File "«pyshell£23» ", line 1, in < mule» 
x-math.sqrt (9)if 5> 3 else randam.randint (1,100) 
NemeError: name 'math' is not defined 
»»» import math 
# 此 时 没有 导入 randem 模 块 ,由 于 条 件 表达 式 5> 3 的 值 为 True, 所 以 可 以 正常 运行 
»»»x-math.sqrt (9)if 5> 3 else randam.randint (1, 100) 
# 第 一 个 条 件 表达 式 2» 3 的 值 为 False, 需 要 计算 第 二 个 表达 式 的 值 ,然而 此 时 还 没有 导入 random BE 
块 ,从 而 出 错 
»»»x-math.sqrt (9)if 2> 3 else randam.randint (1, 100) 
Traceback (most. recent. call last): 
File "«pyshellf£26» ", line 1, in < module» 
x-math.sqrt (9)if 2» 3 else randam.randint (1,100) 
NemeError: name 'random' is not defined 
>> > import randcm 
»»»x-math.sqrt (9)if 2» 3 else randm.randint (1, 100) 


ie . 638 TE REE HII «np ULSE HAE Ap Sce TE R . (Bax FE PO (3 T 


读 性 非常 不 好 ,不 建议 使 用 。 
2»»x-3 
>>> (1 if x> 2 els 0)if f(x)» 5 else('a' if x« 5 else 'b') 
# 可 以 嵌 套 使 用 ,但 不 提倡 这 样 用 
1 
»»»x-0 


>>> (1 if x> 2 else 0)if f(x)» 5 else('a' if x< 5 else 'b') 


a 


3. 多 分 支 选择 结构 
多 分 支 选择 结构 为 用 户 提供 了 更 多 的 选择 ,可 以 实现 复杂 的 业务 逻辑 ,多 分 支 选择 结 


构 的 语法 为 


秆 表达 式 1: 
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语句 块 n 
其 中 ,关键 字 elif 是 else if 的 缩写 。 下 面 的 代码 演示 了 如 何 利用 多 分 支 选择 结构 将 成 绩 
从 百分制 变换 到 等 级 制 。 


>>> def func(score) : 
if score» 100: 
return 'wrong score.must <= 100." 
elif score » — 90: 
return 'A' 
elif score » — 80: 
return 'B' 
elif score » — 70: 
retum 'C' 
elif score » — 60: 
retum 'D' 
elif score » - 0: 
retum 'E' 
else: 
return 'wrong score.must » 0" 
>>> func (120) 
"wrong score.must <= 100." 
>>> func(99) 
"AS 
»»»func(87) 
"B 
»»»func(&2) 
"p 
»»»func(3) 
"E 
»»»func(- 10) 
"wrong score.must > 0' 


4. JEFES BU HUE 
XE FEAS Fg nT UL IET ECEOIERGA EAE IR M GEAR REEL. 
迁 表 达 式 1: 
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s 
语句 块 1 
表达 式 2: 
语句 块 2 
else: 
语句 块 3 
else: if KARI: 
if RER 4: 语句 块 1 
语句 块 4 认 表 达 式 2 : 
1 2 | 3 | 语句 块 2 
上 面 语法 示意 中 的 代码 层次 和 隶属 关系 如 图 3-4 所 else: 
示 ,注意 相同 层次 的 代码 必须 具有 相同 的 缩 进 量 。 3 | 语句 块 3 
使 用 说 套 选 择 结构 时 ,一 定 要 产 格 控制 好 不 同 级 别 else: 
代码 块 的 缩 进 量 , 因 为 这 决定 了 不 同 代 码 块 的 从 属 关 系 并 表达 式 4: 
和 业务 迎 辑 是 否 被 正确 地 实现 ,以 及 代码 是 否 能 够 被 2 3 | 语句 块 4 


Python 正确 理解 和 执行 。 例 如 ,前 面 百分制 转 等 级 制 的 


图 3-4 代码 层次 与 隶属 关系 
代码 ,作为 一 种 编程 技巧 ,还 可 以 尝试 下 面 的 写法 ， 


>> > def func(score) : 
degree- 'DCBARE' 
if score? 100 or score« 0: 
return 'wrong score.must between 0 and 100." 
else: 
index = (score- 60) // 10 
if index >=0: 
return degree[index] 
else: 
return degree[- 1] 
»»»func(- 10) 
"wrong score.must between 0 and 100." 
»»»func(30) 
"ES 
»»»func(50) 
"ES 
>>> func (60) 
p 
>>> func (93) 
"AS 
>>> func (100) 
"AC 


OMER: 在 IDLE 交互 式 环境 中 每 次 只 能 执行 一 条 语句 ,如 果 需 要 编写 多 条 


语句 实现 复杂 的 业务 逻辑 ,需要 创建 一 个 Python 程序 文件 ; ORELHA H KEMER 
结构 以 及 选择 结构 与 循环 结构 的 互相 谋 套 代码 中 , 缩 进 一 定 要 控制 好 ,保证 代码 的 隶属 关 
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系 正 确 。 


313 X B f o 
例 3-1 面试 资格 确认 。 


age- 24 
subject- "计算 机 " 
college- FEA" 
if(age» 25 and subject- - "电子 信息 工程 ")or(collegqe== "E Ñ " and subject==" 电 子 信 息 工程 ")or (age 
<=28 and subject==" 计 算 机 "): 

print ("s RE ,您 已 获得 我 公司 的 面试 机 会 !") 
else: 

print ("H8 dC ARAA ti X ER ") 


(Dog. 在 编写 条 件 表 达 式 时 ,建议 适当 使 用 括号 ,这 样 可 以 更 准确 地 表达 业务 远 
辑 , 同 时 提高 代码 可 读 性 。 

例 3-2 用 户 输入 若干 个 成 绩 , 求 所 有 成 绩 的 平均 分 。 每 输入 一 个 成 绩 后 询问 是 否 
继续 输入 下 一 个 成 绩 ,回答 yes 就 继续 输入 下 一 个 成 绩 , 回 答 no 就 停止 输入 成 绩 。 


numbers [] 
while True: 
x- input(' 请 输入 一 个 整数 :') 
try: # 异 常 处 理 结构 有 关 知 识 见 第 7 章 
nunbers.append (int (x) ) 
exoept: 
print(' 不 是 整数 ') 
while True: 
flag input ("继续 输入 吗 ? (yes/no) ') 
if flag.lower ()not in('yes', 'no"): # 限 定 用 户 输入 内 容 必 须 为 yes s no 
print ("只 能 输入 yes 或 no") 
else: 
break 
if flag.lower()== 'no': 
break 


print (sum (nunbers) /len (numbers) ) 

例 3-3 编写 程序 ,判断 今天 是 今年 的 第 几 天 。 

import time 

date time.localtime () # 获 取 当 前 日 期 时 间 

year,month, day= date[:3] 

day month- [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31] 

if year&400-— 0 or (year$4- — 0 and year&100!- 0) : # 判 断 是 否 为 头 年 
day month[1]- 29 
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if month--1: 
print (day) 

else: 
print(sum(day month[:month- 1])+ day) 


QARMA: Python 标准 库 datetime。 这 个 标准 库 提供 了 timedelta 对 象 可 以 很 方 


便 地 计算 指定 年 \ 月 、 日 时、 分 、 秒 之 前 或 之 后 的 日 期 时 间 , 还 提供 了 返回 结果 中 包含 “ 今 
天 是 今年 第 几 天 ”“ 今 天 是 本 周 第 几 天 ”等 答案 的 timetuple() 函 数 , 等 等 。 


>>> inport datetime 

>>> Today= datetime.date.today () 

>>> Today 

datetime.date (2015, 12, 6) 

>>> Today- datetime.date (Today.year, 1, 1)* datetime.timedelta (days= 1) 
datetime.timedelta (340) 


>>> Today.timetuple().tm yday # 今 天 是 今年 的 第 几 天 
340 

>>> Today. replace (year= 2013) # 替 换 日 期 中 的 年 
datetime.date (2013, 12, 6) 

>>> Today.replace (month- 1) # 蔡 换 日 期 中 的 月 


datetime.date (2015, 1, 6) 
>> > now- datetime.datetime.now() 

2»»now 

datetime.datetime (2015, 12, 6, 16, 1, 6, 313898) 

> > > now.replace (second- 30) # 蔡 换 日 期 时 间 中 的 秒 
datetime.datetime (2015, 12, 6, 16, 1, 30, 313898) 

> > > nowt catetime.timedelta (days- 5) # 计 算 5 天 后 的 日 期 时 间 
datetime.datetime (2015, 12, 11, 16, 1, 6, 313898) 

> > > nowt catetime.timedelta (weeks - 5) # 计 算 5 周 前 的 日 期 时 间 
datetime.datetime (2015, 11, 1, 16, 1, 6, 313896) 


(QARAR: 标准 库 calendar 也 提供 了 一 些 与 日 期 操作 有 关 的 方法 。 例 如 : 


>>> inport calendar # 导 入 模块 

>>>print (calendar.calendar (2016)) # 查 看 2016 年 日 历 表 , 结 果 略 
»»» print (calendar month (2016, 4)) # 查 看 2016 年 4 月 份 的 日 历 表 
>>> calendar.isleap(2016) # 判 断 是 否 为 头 年 

True 

>>> calendar.weekday (2016, 4, 26) # 查 看 指定 日 期 是 周 几 


1 


(QARAR: 也 可 以 自己 编写 代码 模拟 Python 标准 库 calendar 中 查看 日 历 的 


fram datetime import date 
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daysOfMpnth= [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31] 


def myCalendar (year, month) : 
# 获 取 year 年 month 月 1 日 是 周 几 
start- date (year, month, 1).timetuple().tm wday 


# 打 印 头 部 信息 
Print('{0} 年 1 月 日 历 '.fommat (year,month) .center(56)) 
print(t'.join'H 一 二 三 四 五 六 '.split()) 
# 获 取 该 月 有 多 少 天 ,如 果 是 2 月 并 且 是 头 年 ,适当 调整 一 下 
day- daysofMonth [month- 1] 
if month-- 2: 

if yeart400- — 0 or (yeart4- — 0 and yeart100!- 0) : 

day +=1 

# 生 成 数据 ,根据 需要 在 前 面 填充 空白 


result- [' '* 8 for i in range (start+ 1)] 
result += list (map (lambda d: str (d) .ljust (8), range(1, day* 1))) 
# 打 印 数据 
for i, day in enumerate (result) : 

if i!-0andi$7--0: 

print() 

print (day, end- '') 

print() 
def main (year, month= - 1): 

if type(year) != int or year« 1000 or year» 10000: 


print('Year error') 


retum 

if type (month)== int: 

# 如 果 没 有 指定 月 份 ,就 打印 全 年 的 日 历 
if month---1: 


for m in range(l, 13): 
myCalendar (year, m) 
# 如 果 指 定 了 月 份 ,就 只 打印 这 一 个 月 的 日 历 
elif month in range (1,13) : 
myCalendar (year, month) 
else: 
print ("Month error') 
retum 
else: 
print ("Month error') 
retum 
main (2017) 
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s 


3.2 循环 结构 


《道德 经 ) 云 :“ 反 者 , 道 之 动 ”, 认 为 循环 是 道 的 运动 方式 ,这 充分 说 明了 循环 的 重 
要 性 。 


321 fo 循环 与 while 循 环 的 基本 语法 


一 只 羊 , 两 只 羊 , 三 只 羊 , 四 只 羊 ,五 只 羊 …… 有 过 失眠 经 历 的 朋友 应 该 都 数 过 羊 (为 
什么 是 羊 而 不 是 其 他 动物 呢 ? 我 研究 的 非 权 威 结果 是 羊 的 发 音 口 型 变化 少 并 且 动 作 幅 度 
小 ,而 很 多 人 在 默念 的 时 候 嘴 会 不 由 自主 地 跟着 发 音 动 。 于 是 结论 来 了 , 试 着 数 一 数 马 、 
牛 \ 猪 , 鸡 , 鸭 、 鱼 .老虎 .桌子 或 者 其 他 东西 , 口 型 变化 较 大 而 对 注意 力 要 求 较 高 ,所 以 不 容 
易 人 睡 ) ,不 停 地 重复 一 件 事情 ,时 间 久 了 会 非常 无 聊 , 然 后 大 脑 就 会 由 于 疲劳 而 容易 人 
睡 。 当 然 了 ,前 提 是 不 要 数 着 数 着 羊 却 想起 了 烤 羊肉 串 和 扎 啤 。 
重复 性 的 劳动 会 使 人 疲劳 ,而 计算 机 不 会 ,只 要 代码 写 得 正确 ,计算 机 就 会 孜孜 不 倦 、 
不 知 疲劳 地 重复 工作 。 在 Python 中 主要 有 两 种 形式 的 循环 结构 : for 循环 和 while (ff 
环 。while 循环 一 般 用 于 循环 次 数 难 以 提前 确定 的 情况 ,当然 也 可 以 用 于 循环 次 数 确定 
的 情况 ;for 循环 一 般 用 于 循环 次 数 可 以 提前 确定 的 情况 ,尤其 适用 于 枚 举 或 遍历 序列 或 
和 迭代 对 象 中 元 素 的 场合 。 当 循环 带 有 else 子 句 时 ,如 果 循 环 因为 条 件 表达 式 不 成 立 或 序 


[else: 
else 子 名 代码 块 ] 


for 取 值 in 序列 或 迭代 对 象 : 
循环 体 

[else: 
else 子 名 代码 块 ] 


其 中 , 方 括号 内 的 else 子 句 可 以 没有 ,也 可 以 有 。 下 面 的 代码 演示 了 带 有 else 子 句 的 循 
环 结 构 ,该 代码 用 来 计算 1 十 2 十 3 十 … 十 99 十 100 的 结果 。 


>>>=0 

»»»foriinrange(l, 101): # 不 包括 10 
st-i 

else: 
print(s) 

5050 
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下 面 的 代码 使 用 while 循环 实现 了 同样 的 功能 : 


»»»s5-i-0 
»»»while i <= 100: 
St-i 
it-1 
else: 
print(s) 
5050 


下 面 的 代码 巧妙 运用 range O 函数 来 控制 循环 次 数 ,输出 由 星 号 (* O A R EE 
图 案 : 
def main(n): 
for i in range (n): 
print((' * '* i).center(n* 3)) 


for i in range(n, 0, - 1): 
print((' * '* i).center(n* 3)) 


main(6) 


(post. 编程 时 一 般 优先 考虑 使 用 for 循环 。 
322 break 与 continue 语 句 


break 语句 和 continue 语句 在 while 循环 及 for 循环 中 都 可 以 使 用 ,并 且 一 般 常 与 选 
择 结构 结合 使 用 。 一 旦 break 语句 被 执行 ,将 使 得 break 语句 所 属 层次 的 循环 提前 结束 。 
continue 语句 的 作用 是 提前 结束 本 次 循环 ,并 忽略 continue 之 后 的 所 有 语句 ,直接 回 到 循 


环 的 顶端 ,提前 进入 下 一 次 循环 。 
下 面 的 代码 用 来 计算 小 于 100 的 最 大 素数 ,可 以 看 出 break 语句 在 循环 中 的 作用 。 


»»»forninrange(100, 1, - 1): 
for i in rangeQ, n): 


ifrn&i--0: 
break # 结 束 内 循环 
else: 
print (n) 
break # 结 束 外 循环 


97 


删除 上 面 代码 中 最 后 一 个 break 语句 ,并 对 输出 语句 略 加 修改 , 则 可 以 用 来 输出 100 
以 内 的 所 有 素数 ,例如 : 
>>> for n in range(100, 1, -1): 


for i in range(2, n): 
if i ==0: 
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break 
else: 
print(n, end- ' ') 
9789 83 79 73 71 6 61 59 53 47 4341 3731 292319 1713117 532 


您 注意 : 过 多 的 break 和 continue 语句 会 降低 程序 的 可 读 性 。 除 非 break 或 
continue 语句 可 以 让 代码 更 简单 或 更 清晰 ,否则 不 要 轻易 使 用 。 


323 循环 代码 优化 技巧 


学 过 太极 拳 的 朋友 应 该 听 说 过 一 句 话 : 要 把 拳 练 好 , 必 把 圈 练 小 。 一 般 而 言 ,功夫 越 
深 的 人 外 形 动作 越 小 ,编写 代码 也 是 同样 的 道理 。 在 满足 功能 要 求 的 前 提 下 应 该 追求 代 
码 的 短小 精 悍 ,而 这 也 是 对 Python 内 功 的 考验 。 虽 然 不 至 于 “两 句 三 年 得 ,一 吟 双 泪 
流 ”, 但 确实 也 是 需要 经 过 反复 推荐 的 。 有 不 少 人 编写 代码 之 前 没有 经 过 系统 地 规划 ,也 
没有 经 过 深思 熟 虑 ,完全 是 赁 着 感觉 走 , 想 到 哪 写 到 哪 , 写 的 时 候 还 反复 地 修改 前 面 的 代 
码 。 对 于 一 些小 的 程序 这 样 做 是 可 以 的 ,但 是 对 于 大 型 软件 开发 ,这 种 “不 管 黑 猫 白 猫 , 抓 
到 老鼠 就 是 好 猫 ” 的 态度 是 可 怕 的 。 编 写 代 码 时 ,不 仅 要 考虑 功能 ,还 要 考虑 性 能 以 及 可 
维护 性 .可 扩展 性 、 可 移植 性 等 。 

虽然 现在 的 计算 机 配置 越 来 越 高 ,内 存 越 来 越 大 ,速度 越 来 越 快 ,计算 能 力 越 来 越 强 ， 
各 种 云 平台 更 是 提供 了 惊人 的 存储 空间 和 计算 能 力 , 但 作为 一 种 美德 ,还 是 要 合理 利用 资 
源 ,能 少 用 一 点 资源 就 省 一 点 ,能 让 代码 运行 更 快 一 点 就 尽量 优化 一 下 ,同时 也 能 给 代码 
进行 适当 “减肥 ”来 增加 可 读 性 。 在 编写 循环 语句 时 ,应 尽量 减少 循环 内 部 不 必要 或 无 关 
的 计算 ,将 与 循环 变量 无 关 的 代码 尽 可 能 地 提取 到 循环 之 外 ,这 样 可 以 提高 代码 的 执行 效 
率 。 对 于 使 用 多 重 循环 嵌 套 的 情况 ,应 尽量 减少 内 层 循环 中 不 必要 的 计算 , 尽 可 能 地 向 外 
提 。 例 如 ,下 面 的 代码 ,第 二 段 明显 比 第 一 段 的 运行 效率 要 高 。 

import time 

digits = (1, 2, 3, 4) 


start- time.time() 
for i in range (1000) : 

result- [] 

for i in digits: 

for j in digits: 
for k in digits: 
result.append(i* 100+ j* 1% k) 

print (time.time ()- start) 


start- time.time() 
for i in range (1000) : 
result- [] 
for i in digits: 
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i=i* 100 
for j in digits: 
于 jx 10 
for k in digits: 
result.append (i+ j+ k) 
print (time.time ()- start) 


0.021001100540161133 


另外 ,在 循环 中 应 尽量 引用 局 部 变量 ,局 部 变量 的 查询 和 访问 速度 比 全 局 变量 略 快 ， 


在 使 用 模块 中 的 方法 时 ,可 以 通过 将 其 转换 为 局 部 变量 来 提高 运行 速度 。 例 如 下 面 的 


代码 : 


import time 
import math 


start- time.time() # 获 取 当 前 时 间 
for i in range (10000000) : 

math.sin(i) 
print('Time Used:', time.time()- start) # 输 出 所 用 时 间 


loc sin-math.sin 

start- time.time() 

for i in range (10000000) : 
loc sin(i) 


print ('Time Used:', time.time()- start) 
运行 结果 如 下 : 


Time Used: 3.600205898284912 
Time Used: 3.0221729278564453 


虽然 速度 提高 并 不 是 非常 多 ,但 是 对 于 某 些 对 实时 性 要 求 特别 高 的 应 用 场景 一 点 点 


的 提高 也 是 有 意义 的 。 而 实际 上 ,上 面 这 段 代码 还 有 优化 的 空间 ,大 家 能 想到 吗 ? 本 书 其 


他 地 方 介绍 过 ,尝试 着 找 一 下 。 
《太极 尺寸 分 毫 解 ) 日 “功夫 先 练 开展 ,后 练 紧凑 ”。 编 写 代 码 也 是 同样 的 道理 ,首先 要 


把 代码 写 对 ,保证 完全 符合 功能 要 求 ,然后 再 进行 必要 的 优化 来 提高 性 能 。 过 早 地 追求 性 
能 优化 有 时 可 能 会 带 来 灾难 而 浪费 大 量 精力 。 代 码 优化 涉及 的 面 非常 广 ,对 程序 员 的 功 
底 要 求 很 高 。 除 了 上 面 介绍 的 循环 代码 优化 .第 2 章 和 第 5 章 中 介绍 的 内 容 中 也 涉及 一 
些 优化 的 内 容 。 例 如 ,如 果 经 常 需要 测试 一 个 序列 是 否 包含 一 个 元 素 就 应 该 尽量 使 用 字 
典 或 集合 而 不 使 用 列表 ,连接 多 个 字符 串 时 尽量 使 用 join() 方 法 而 不 要 使 用 运算 符 十 ,对 


列表 进行 元 素 的 插入 和 删除 操作 时 应 尽量 从 列表 尾部 进行 ,等 等 。 
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例 3-4 输出 序列 中 的 元 素 。 
对 于 类 似 元 素 遍历 的 问题 ,一 般 也 优先 考虑 使 用 for 循环 ,参考 代码 如 下 : 
a list- ['a', 'b', mpilgrim', 'z', 'example'] 
for i, v inenmerate(a list): 

print ("列表 的 第 ', i+1, ' 个 元 素 是 :', v) 
例 3-5 求 1 一 100 之 间 能 被 7 整除 ,但 不 能 同时 被 5 整除 的 所 有 整数 。 
该 例 主 要 介绍 条 件 表达 式 的 写法 ,参考 代码 如 下 : 
for i in range(l, 101): 

ifi$7--0andi$5 !=0: 

print (i) 
例 3-6 输出 “水 仙 花 数 ”。 
所 谓 水 仙 花 数 是 指 一 个 3 位 的 十 进 制 数 ,其 各 位 数字 的 立方 和 恰好 等 于 该 数 本 身 。 
例如 ,153 是 水 仙 花 数 ,因为 153 王 1 十 5 十 3 。 

for i in range(100, 1000): 

ge-i $10 

shi- i // 10 %10 

bai-i // 100 

if ge** 3+ shiX* 3 baix*3 ==i: 

print (i) 

例 3-7 求 平均 分 。 
score- [70, 90, 78, 85, 97, 94, 65, 80] 
s0 
for i in score: 

s+=i 


print (s / len(score)) 

当然 也 可 以 使 用 下 面 的 内 置 函 数 来 计算 平均 分 : 

print (sum(score) / len(score)) 

您 注意 : 在 Python 2.x 中 ,/ 运 算 符 与 Python 3.x 的 解释 不 一 样 ,对 于 上 面 的 代码 ， 
在 Python 2.x 中 需要 写成 下 面 的 样子 : 

print(sum(score) * 1.0 / len(score)) 


例 3-8 打印 九 九 乘法 表 。 
该 例 主 要 介绍 循环 结构 的 嵌 套 用 法 和 循环 条 件 的 控制 ,参考 代码 如 下 : 


for i in range(L 10): 
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for j in range(l, i+1): 
print('(0)* (1)- {2}" .fomat (i,j,i¥* j), end-' ') 
print () 打印 空 行 
例 3-9 求 200 以 内 能 被 17 整除 的 最 大 正 整数 。 
熟练 掌握 range() 函数 的 用 法 .对 于 很 多 循环 来 说 可 能 起 到 事半功倍 的 效果 ,参考 代 
码 如 下 : 


for i in range (200, 0, - 1): 
if i$17 ==0: 
print (i) 
break 
例 3-10 判断 一 个 数 是 否 为 素数 。 
在 该 例 中 ,重点 演示 循环 结构 中 else 子 句 的 用 法 。 


import math 


r= input ("Input an integer:") 

mint (n) 

me int (math.sqrt (n)+ 2) 

for i in range(2, m): 

if n$i--0: 
print ("ho") 
break 
else: 
print ("es") 

(以 拓展 知识 : math 是 用 于 数学 计算 的 标准 库 。 除 了 用 于 平方 根 函 数 sqrt() 和 取 整 
3h ceil() ,Python 标准 库 math 还 提供 了 最 大 公约 数 函 数 gcd(),sin() asino AF f $ 
数 与 反 三 角 函 数 ,弧度 与 角度 转换 函数 degrees() 和 radians O ,误差 函数 erf()、 剩 余 误 差 
BA erfc()、 伽 马 函数 gamma() ,对 数 函 数 log O log2() ,log10O ,阶乘 函数 factorial()， 
常数 pi 和 e, 等 等 。 

例 3-11 鸡 兔 同 笼 问题 。 假 设 共 有 鸡 、 免 30 只 , 脚 90 只 , 求 鸡 、 免 各 有 多 少 只 ? 

for ji in range(0, 31): 

if2* ji + (30- ji) * 4-- 90: 
print('ji:', ji, ' tur', 30- 5i) 

E 趣味 拓展 : 所 有 鸡 、 免 听 口 令 , 抬 起 一 条 腿 , 再 抬 起 一 条 腿 , 好 吧 , 现 在 所 有 的 鸡 者 
目 瞪 口 采 地 坐 地 上 了 (难道 这 就 是 传说 中 的 采 著 木 鸡 ) ,站 着 的 都 是 还 有 两 条 腿 站 立 的 免 
子 ( 免 子 表 示 压 力也 很 大 ) ,这 时 站 立 着 的 腿 的 数量 的 一 半 是 兔子 ,当然 如 果 得 到 的 数字 不 
是 整数 则 表示 无 解 。 代 码 如 下 : 


def demo (jitu, tui): 
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tu= (tui- jitu* 2/2 
if int(tu)- — tu: 
return(int (jitu- tu), int(tu)) 


print (demo(30, 90)) 


例 3-12 编写 程序 ,输出 由 1,2,3,4 这 4 个 数字 组 成 的 每 位 数 都 不 相同 的 所 有 三 
位 数 。 


digits = (1, 2, 3, 4) 
for i in digits: 
ii-i* 100 
for j in digits: 
if j==i: 
continue 
jj-j* 10 
for k in digits: 
if k--iork--j: 
continue 
print (ii+ jj+ k) 
例 3-13 编写 程序 ,计算 组 合 数 COL D BIA n PERMER i 个 ,有 多 少 种 选 法 ? 
根据 组 合 数 的 定义 ,需要 计算 3 个 数 的 阶乘 ,在 很 多 编程 语言 中 都 很 难 直接 使 用 整 型 
变量 表示 大 数 的 阶乘 结果 ,虽然 Python 并 不 存在 这 个 问题 ,但 是 计算 大 数 的 阶乘 仍 需要 
相当 多 的 时 间 。 例 如 ， 


»»»defCnil(n, i): 

import math 

return int (math. factorial (n) /math. factorial (i) /math. factorial (n- i)) 
»»»Cni2(6,2) 
15 


现在 我 们 换个 角度 来 看 这 个 问题 。 容 易 知道 ,Cni(8,3) 二 8! /3! /(8—3)!=(8X 
7X6X5X4X3X2X1)/(3X2X1)/(5X4X3X2X1), 简 单 分 析 可 以 发 现 , 对 于 (5,8] 区 
间 的 数 , 分 子 上 出 现 一 次 而 分 母 上 没 出 现 ; (3,5j 区 间 的 数 在 分 子 、 分 母 上 各 出 现 一 次 ; 
[1,3j 区 间 的 数 分 子 上 出 现 一 次 而 分 母 上 出 现 两 次 。 根 据 这 一 规律 ,可 以 编写 如 下 非常 高 
效 的 组 合 数 计算 程序 。 


def Cni2(n,i): 
if not (isinstance (n, int)and isinstance (i,int)and n>=i): 
print('n and i must be integers and n must be larger than or equal to i.') 
retum 
result=1 
Min, Max- sorted( (i,n- i)) 
fori inrange(n,0,-1): 
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if i»Max: 
result * =i 
elif i<=Min: 
result /=i 
retum result 
print (Cnil (6,2) ) 


QARR: 有 时 候 换个 角度 来 思考 和 解决 问题 ,或 许 会 更 加 有 效 和 快捷 。 例 如 ， 
在 信号 处 理 领域 ,时 域 或 空域 的 卷 积 对 应 于 变换 域 中 的 乘法 。 再 例如 , 现 有 100 名 乒乓 球 
运动 员 采 用 淘汰 赛 的 方式 进行 比赛 , 问 至 少 需要 多 少 场 比赛 才能 决 出 冠军 呢 ? 肯定 有 读 
者 立刻 就 提 笔 计算 了 ,50 十 25 十 12 十 …，, 计 算 的 时 候 遇 到 剩余 人 数 为 奇数 的 时 候 还 要 纠结 
一 会 儿 。 实 际 上 换个 角度 可 以 这 样 来 起 ,所 谓 淘汰 赛 就 是 每 比 一 场 就 下 去 一 个 人 ,而 所 谓 
决 出 冠军 就 是 最 后 只 剩 下 一 个 人 ,所 以 需要 淘汰 99 个 人 ,至 少 需要 比赛 99 场 。 

COL 拓展 知 识 : 也 可 以 直接 使 用 Python 标准 库 itertools 提供 的 函数 来 解决 组 合 数 计 
算 的 问题 。 


>>> inport itertools 
>>> len (tuple (itertools.carbinations (range (60) ,2)) ) 
1770 


计算 组 合 数 时 如 果 数 值 n 和 i 较 大 ,建议 使 用 前 面 定义 的 Cni2 O RRE, AS HE USE JI 
combinations() 和 Cnil() 函 数 ,因为 这 会 增加 大 量 的 额外 操作 其 至 导致 死机 。 

combinations() 更 多 的 时 候 是 用 来 返回 迭代 对 象 进行 惰性 求 值 ,而 不 是 像 上 面 代码 
所 演示 的 用 法 。 除 了 combinations O 函数 ,itertools 还 提供 了 排列 函数 permutations()、 
用 于 循环 遍历 可 迭代 对 象 元 素 的 函数 cycle O ,根据 一 个 序列 的 值 对 另 一 个 序列 进行 过 滤 
的 函数 compress O ,根据 函数 返回 值 对 序列 进行 分 组 的 函数 groupby() 。 


>>> import itertools 
»»»x-'Private Key' 
>>> y= itertools.cycle (x) # 循 环 遍历 序列 中 的 元 素 
>>> for i in range (20): 
print (next (y), end ',') 
P,r,i,v,a,t,e, ,K,e, y, P,r,i,v,a,t,e, ,K, 
>>> for i in range(5): 
print (next (y), end- ',") 
ey,P,r, i, 
»»»x-range(l, 20) 
>>>y= (1,0) * 9+ (1,) 
>>>y 
Q, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, O, 1, O, 1, O, 1, 0, 1) 
»»»list(itertools.camress (x, y)) # 根 据 一 个 序列 的 值 对 另 一 个 序列 进行 过 滤 
[1, 3, 5, 7, 9, 11, 13, 15, 17, 19] 
>>> def gromp(v): 
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return 'between 5 and 10' 
»»»x-range (20) 
>>> y-itertools.grourby (x, group) # 根 据 函数 返回 值 对 序列 元 素 进 行 分 组 
>>>for k viny: 

print(k, ':', list(v)) 
less than 5 : [0, 1, 2, 3, 4] 
between 5 and 10 : [5, 6, 7, 8, 9, 10] 
greater than 10 : [11, 12, 13, 14, 15, 16, 17, 18, 19] 
>>> list(itertools.permiations([1, 2, 3, 4], 3) 

# 从 4 个 元 素 中 任 选 3 个 的 所 有 排列 

»»»x-itertools.pemmitations ([1,2,3,4], 4) #4 个 元 素 全 排列 
>>> next (x) 
(1, 2, 3, 4) 
»»»next(x) 
(L, 2, 4, 3) 
>>> next (x) 
(L, 3, 2, 4) 


例 3-14 编写 程序 ,计算 理财 产品 收益 ,假设 利息 和 本 金 一 起 深 动 。 


def licai (base, rate, days): 
result-base # 初 始 投资 金额 
times- 365//days # 整 除 ,用 来 计算 一 年 可 以 滚动 多 少 期 
for i in range (times): 
result- result + result * rate/365x days 
return result 
print (licai (100000, 0.0385, 14)) #14 天 理财 ,利率 为 0.0385, 38: E 10 77 76 


3.3 函数 设计 与 使 用 


大 家 在 初中 数学 课程 中 就 学 习 过 函数 的 概念 ,函数 表示 从 自 变量 到 因 变量 之 间 的 一 
种 映射 或 对 应 关系 。 软 件 开发 中 的 函数 也 具有 相似 的 含义 ,也 是 把 输入 经 过 一 定 的 变换 
和 处 理 最 后 得 到 预定 的 输出 ,如 图 3-5 所 示 。 从 外 部 来 看 ， 
函数 就 像 一 个 黑 盒子 ,不 需要 了 解 内 部 原理 ,只 需要 了 解 其 
接口 或 使 用 方法 即 可 。 图 3-5 函数 示意 图 

在 软件 开发 过 程 中 ,经 常 有 很 多 操作 是 完全 相同 或 者 是 
非常 相似 的 ,仅仅 是 要 处 理 的 数据 不 同 而 已 ,因此 经 常会 在 不 同 的 代码 位 置 多 次 执行 相似 
或 完全 相同 的 代码 块 。 很 显然 ,从 软件 设计 和 代码 复 用 的 角度 来 讲 , 直 接 将 该 代码 块 复制 


输入 一 | 函数 | 一 一 输出 
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到 多 个 相应 的 位 置 然 后 进行 简单 修改 绝对 不 是 一 个 好 主意 。 虽 然 这 样 可 以 使 得 多 份 复制 
的 代码 可 以 彼此 独立 地 进行 修改 ,但 这 样 不 仅 增加 了 代码 量 , 也 增加 了 代码 阅读 、 理 解 和 
维护 的 难度 ,更 重要 的 是 为 代码 测试 和 纠 错 带 来 了 很 大 的 困难 。 一 旦 被 复制 的 代码 块 将 
来 某 天 被 发 现存 在 问题 而 需要 修改 , 则 必须 对 所 有 的 复制 都 做 同样 正确 的 修改 ,这 在 实际 
中 是 很 难 完成 的 一 项 任务 。 由 于 代码 量 的 大 幅度 增加 ,导致 代码 之 间 的 关系 更 加 复杂 ,很 
可 能 在 修补 旧 漏 洞 的 同时 又 引入 了 新 漏洞 。 因 此 ,应 尽量 减少 使 用 直接 复制 代码 块 的 方 
式 来 实现 复 用 。 解 决 这 个 问题 的 有 效 方法 是 设计 函数 (function) 和 类 (class) 。 本 章 介绍 
函数 的 设计 与 使 用 ,第 4 章 介绍 面向 对 象 程序 设计 。 

将 可 能 需要 反复 执行 的 代码 封装 为 函数 ,并 在 需要 执行 该 段 代 码 功 能 的 地 方 进 行 调 
用 ,这 不 仅 可 以 实现 代码 的 复 用 ,更 重要 的 是 可 以 保证 代码 的 一 致 性 ,只 需要 修改 该 函数 
用 ,复杂 问题 简单 化 ,使 得 软件 开发 像 搭 积木 一 样 简单 。 当 然 , 在 实际 开发 中 ,需要 对 函数 
进行 良好 的 设计 和 优化 才能 充分 发 挥 其 优势 。 在 编写 函数 时 ,有 很 多 原则 需要 参考 和 遵 
守 , 例 如 ,不 要 在 同一 个 函数 中 执行 太 多 的 功能 ,尽量 只 让 其 完成 一 个 高 度 相关 且 大 小 合 


在 Python 中 ,定义 函数 的 语法 如 下 : 


def 函数 名 (参数 列表 ]): 
"注释 '' 
函数 体 


在 Python 中 使 用 def 关键 字 来 定义 函数 ,然后 是 一 个 空格 和 函数 名 称 , 接 下 来 是 一 
对 圆 括号 ,在 圆 括号 内 是 形式 参数 列表 ,如 果 有 多 个 参数 则 使 用 逗号 分 隔 开 , 圆 括号 之 后 
是 一 个 冒号 和 换行 ,最 后 是 必要 的 注释 和 函数 体 代 码 。 定 义 函 数 时 需要 注意 的 问题 : 
中 函数 形 参 不 需要 声明 其 类 型 ,也 不 需要 指定 函数 返回 值 类 型 ; @ 即 使 该 函数 不 需要 接 
收 任何 参数 ,也 必须 保留 一 对 空 的 圆 括号 ; @ 括 号 后 面 的 冒号 必 不 可 少 ; @ 函 数 体 相对 
于 dc 关键 字 必 须 保持 一 定 的 空格 缩 进 。 

ANER: 注释 可 以 说 是 软件 开发 人 员 的 笔记 ,对 代码 测试 人 员 和 维护 人 员 来 说 
也 非常 重要 。 在 Python 中 有 两 种 注释 的 方式 : 符号 # 后 面 的 内 容 表示 注释 ,不 属于 任何 
语句 的 一 对 三 引号 中 的 内 容 也 表示 注释 。 

器 小 技巧 : 不 少 程序 员 是 编写 完 代码 之 后 再 添加 适当 的 注释 ,我 恰恰 相反 。 我 一 
般 都 是 先 写 注释 ,以 注释 的 形式 用 自然 语言 把 程序 思路 描述 出 来 ,然后 再 把 这 些 注释 " 翻 
译 "成 程序 语言 , 正 所 谓 “ 代 码 未 动 ,注释 先行 "。 

下 面 的 函数 用 来 计算 斐 波 那 契 数列 中 小 于 参数 n 的 所 有 值 : 

def fib(n): # 定 义 函 数 ,括号 里 的 n 是 形 参 
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a, b-1,1 
while a<n: 
print(a, end- ' ") 
a, b-b, atb 


print() 
该 函数 的 调用 方式 为 
fib(1000) # 调 用 函数 ,括号 里 的 1000 是 实 参 


在 定义 函数 时 ,开头 部 分 的 注释 并 不 是 必需 的 ,但 是 如 果 为 函数 的 定义 加 上 一 段 注释 
的 话 , 可 以 为 用 户 提供 友好 的 提示 和 使 用 帮助 。 例 如 ,把 上 面 生成 斐 波 那 契 数列 的 函数 定 
义 修改 为 下 面 的 形式 ,在 函数 开头 加 上 一 段 注释 。 


>>> def fib(n): 
'''accept an integer n. 
return the numbers less than n in Fibonacci sequence.''' 
a,b-1,1 
while a<n: 
print(a, end- ' ') 
a, b-b, atb 
print() 
Are — K « nT LIE HE VÀ S PR 2C help() 来 查看 函数 的 使 用 帮助 ,并 且 在 调用 该 函数 时 
输入 左 侧 圆 括号 之 后 ,立刻 就 会 得 到 该 函数 的 使 用 说 明 , 如 图 3-6 所 示 。 


>>> def fibt): 
"accept an integer 
um the mumbers less than n in Fibonacci sequence, "' 
b= 


hile a Ka 
print (ay ends") 
b 


print0 


22» print (fib, — doc. ) 
accept an integer 
return the muxbers less than n in Fibonacci sequence. 
>>> help(fib) 
elp on function fib in module main : 


fib(n) 
accept an integer 
return the hibara | less than n in Fibonacci sequence. 


>>> fib( 
(n) 


accept an integer n. 
return the numbers less than n in Fibonacci sequence. —— 


图 3-6 使 用 注释 来 为 用 户 提示 函数 使 用 说 明 


PEN: 如 果 代 码 本 身 不 能 提供 非常 好 的 可 读 性 ,那么 最 好 加 上 适当 的 注释 来 说 
明 , 要 不 然 ,自己 写 的 代码 自己 都 看 不 懂 了 。 很 多 程序 员 都 有 过 这 样 的 经 历 。 

在 Python 中 ,定义 函数 时 不 需要 声明 函数 的 返回 值 类 型 ,而 是 使 用 return 语句 结束 
函数 的 执行 的 同时 返回 任意 类 型 的 值 , 函 数 返回 值 类 型 与 return 语句 返回 表达 式 的 类 型 
一 致 。 无 论 return 语句 出 现在 函数 的 什么 位 置 ,一 旦 得 到 执行 将 直接 结束 函数 的 执行 。 
RUF HOHER return 语句 或 者 执行 了 不 返回 任何 值 的 return ifi], Python 将 认为 该 了 
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AMER: 作为 使 用 者 ,在 调用 函 数 时 ,一 定 要 注意 函数 有 没有 返回 值 ,以 及 是 否 
会 对 函数 实 参 的 值 进 行 修改 。 例 如 ,前 面 第 2 章 介绍 过 的 列表 对 象 方法 sort() 属 于 原 地 
操作 ,没有 返回 值 ,而 内 置 函数 sorted() 则 返回 排序 后 的 列表 ,并 不 对 原 列表 做 任何 修改 。 

>>>a list- [1, 2, 3, 4, 9, 5, 7] 

»»»print(sorted(a list)) 

[1, 2, 3, 4, 5, 7, 9] 


»»»print(a list) # 原 列表 内 容 没 变 

[1, 2, 3, 4, 9, 5, 7] 

»»»print(a list.sort()) # 列 表 对 象 的 sort () 方 法 没有 返回 值 
None 


»»»print(a list) 
O, 2, 3, 4, 5, 7, 9] 


外 ,任何 包含 _call O Z7 80 XE ARETA 89. 06] do CF d 89 AXES TRUST iR EGRE 
套 定 义 的 情况 : 
def linear (a, b): 
def result (x) : # 在 Python 中 ,函数 是 可 以 嵌 套 定义 的 
retuma * xtb 
return result 


下 面 的 代码 演示 了 可 调用 对 象 类 的 定义 : 
class linear: 
def init (self, a, b): 
self.a, self.b- a, b 
def call (self, x): 


retum self.a * x*self.b 


使 用 上 面 的 谋 套 函数 和 类 这 两 种 方式 中 任何 一 个 ,都 可 以 通过 以 下 的 方式 来 定义 一 
个 可 调用 对 象 : 


taxes- linear (0.3, 2) 
然后 通过 下 面 的 方式 来 调用 该 对 象 : 
taxes (5) 


下 面 的 代码 完整 地 演示 了 欢 套 函数 定义 与 使 用 的 方法 ,有 效 利 用 了 用 户 名 检查 功能 
的 代码 ,关于 面向 对 象 编程 的 知识 请 参考 第 4 章 。 
def check permission (func) : 


def wrapper (* args, ** kwargs) : 
if kwargs.get ("username") != 'acmin' : 
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raise Exception ('Sorry. You are not allowed.') 
return func(* args, **kwargs) 
return wrapper 


class ReadriteFile (dbject) : 
# 把 函数 check permission 作为 装饰 器 使 用 
@ check permission 
def read(self, username, filename): 
return open (filename, 'r') .read () 


def write(self, username, filename, content): 
open (filename, 'at ') .write (content) 

# 把 函数 check permission 作为 普通 函数 使 用 

write- check permission (write) 


t- ReadriteFile () 

print ('Originally': ') 

print (t.read(username- 'admin', filename- r'd:Vsemple.txt')) 

print('Now, try to write to a file") 

t.write(username- 'admin', filename- r'd:Vsample.txt', content= 'Anhello world') 
print('After calling to write.» ') 

print (t.read(username- 'admin', filename- r'd:Vsemple.txt')) 
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函数 定义 时 圆 括号 内 是 使 用 逗号 分 隔 开 的 形 参 列表 (parameters) ,一 个 函数 可 以 没 
有 参数 ,但 是 定义 和 调用 时 一 对 圆 括号 必须 要 有 ,表示 这 是 一 个 函数 并 且 不 接收 参数 。 酉 
数 调用 时 向 其 传递 实 参 (arguments) ,根据 不 同 的 参数 类 型 ,将 实 参 的 值 或 引用 传递 给 
形 参 。 
在 定义 函数 时 ,对 参数 个 数 并 没有 限制 ,如 果 有 多 个 形 参 , 则 需要 使 用 逗号 进行 分 隔 。 
例如 ,下 面 的 函数 用 来 接收 2 个 参数 ,并 输出 其 中 的 最 大 值 。 
def printMax (a, b): 
if a>b: 
pimt (a, 'is the max') 
else: 
print(b, 'is the max!) 
您 注意 : 这 里 只 是 为 了 演示 ,忽略 了 一 些 细节 ,如 果 输 入 的 参数 不 支持 比较 运算 , 则 
会 出 错 ,可 以 参考 后 面 第 7 章 中 介绍 的 异常 处 理 结构 来 解决 这 个 问题 。 
对 于 绝 大 多 数 情况 下 ,在 函数 内 部 直接 修改 形 参 的 值 不 会 影响 实 参 。 例 如 : 


>>> def addpne (a) : 


print (a) # 输 出 原 变量 a 的 值 
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a+=1 # 这 条 语句 会 得 到 一 个 新 的 变量 a 


从 运行 结果 可 以 看 出 ,在 函数 内 部 修改 了 形 参 a 的 值 ,但 是 当 函 数 运行 结束 以 后 , 实 
参 a 的 值 并 没有 被 修改 。 然 而 ,在 有 些 情 况 下 ,可 以 通过 特殊 的 方式 在 函数 内 部 修改 实 参 
的 值 ,例如 : 


>>> def mdify(v) : # 修 改 列表 元 素 值 
v[0]- v[0]* 1 

»»»a-[2] 

»»»modify (a) 

»»»a 

[3] 

>>> def mdify(v, item): # 为 列表 增加 元 素 
v.append (item) 

»»»a [2] 

»»»mdify(a, 3) 

>>>a 

2, 3] 

>>> def modify(d): # 修 改 字典 元 素 值 或 为 字典 增加 元 素 
d['age']- 38 

»»»a-('name':'Dong', 'age':37, 'sex':'Male'] 

>>>a 

('age': 37, 'name': 'Dong', 'sex': 'Male') 

»»»modify (a) 

>>>a 

{'age': 38, "name': "Dong', 'sex': 'Male'] 

也 就 是 说 ,如 果 传 递 给 函数 的 是 Python 可 变 序列 ,并 且 在 函数 内 部 使 用 下 标 或 序列 

自身 支持 的 方式 为 可 变 序 列 增加 、 删 除 元 素 或 修改 元 素 值 时 ,修改 后 的 结果 是 可 以 反映 到 
函数 之 外 的 , 即 实 参 也 得 到 了 相应 的 修改 。 


1. 默认 值 参 数 
在 定义 函数 时 ,Python 支持 默认 值 参 数 , 即 在 定义 函数 时 为 形 参 设置 默认 值 。 在 调 


用 带 有 默认 值 参数 的 函数 时 ,可 以 不 用 为 设置 了 默认 值 的 形 参 进行 传 值 ,此 时 函数 将 会 直 
接 使 用 函数 定义 时 设置 的 默认 值 , 也 可 以 通过 显 式 赋值 来 蔡 换 其 默认 值 。 也 就 是 说 ,在 调 
用 函数 时 是 否 为 默认 值 参数 传递 实 参 是 可 选 的 ,具有 较 大 的 灵活 性 。 带 有 默认 值 参 数 的 


函数 定义 语法 如 下 : 
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def 函数 名 (…, 形 参 名 = 默认 值 ): 
函数 体 


可 以 使 用 “函数 名 .__defaults_” 随 时 查看 函数 所 有 默认 值 参 数 的 当前 值 , 其 返回 值 
为 一 个 元 组 ,其 中 的 元 素 依次 表示 每 个 默认 值 参 数 的 当前 值 。 例 如 下 面 的 函数 定义 : 


>>> def say (message, times =1): 
print((messaget' ')* times) 

>>> say.func defaults 

[i 


调用 该 函数 时 ,如 果 只 为 第 一 个 参数 传递 实 参 , 则 第 二 个 参数 使 用 默认 值 1; 如 果 为 
第 二 个 参数 传递 实 参 , 则 不 再 使 用 默认 值 1 ,而 是 使 用 调用 者 显 式 传递 的 值 。 


>>> say('hello') 

hello 

>>> say('hello', 3) 

hello hello hello 

>>>say('hi', 7) 

hihihihihihihi 

EEE: 在 定义 带 有 默认 值 参数 的 函数 时 ,默认 值 参数 必须 出 现在 函数 形 参 列表 的 
最 右 端 ,任何 一 个 默认 值 参数 右边 都 不 能 再 出 现 非 默认 值 参数 。 

您 注意 : 一 般 情况 下 ,都 是 调用 函数 时 为 其 传递 参数 ,这 时 形 参 的 值 由 调用 函数 时 
实 参 的 值 确定 。 但 如 果 函 数 的 默认 值 参数 不 是 调用 时 传递 的 ,而 是 通过 其 他 方式 对 其 赋 
值 ,那么 默认 值 参 数 的 值 可 能 会 在 函数 定义 时 确定 ,而 不 是 函数 调用 时 。 例 如 : 


>>>i=5 
>>> def dem(v): 
print (v) 
»»»i-6 
»»»da() # 调 用 时 明确 传递 参数 值 
6 
>>>i=5 
>>> œf dem(v-i): 
print (v) 
»»»i-6 
>>>dem() # 调 用 时 没有 传递 参数 值 
5 


您 注意 : 多 次 调用 函数 并 且 不 为 默认 值 参数 传递 值 时 ,默认 值 参 数 只 在 第 一 次 调用 
时 进行 解释 ,对 于 列表 、 字 典 这 样 可 变 类 型 的 默认 值 参数 ,这 一 点 可 能 会 导致 很 严重 的 逻 
辑 错误 ,而 这 种 错误 或 许 会 耗费 大 量 精力 来 定位 和 纠正 。 例 如 下 面 的 代码 : 


def demo (newitem, old list- []): 
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old list.append(newi tem) 
return old list 


print (demo ('S', [1, 2, 3, 4])) 
print(demo('asa', ['a', 'b'])) 
print (demo ('a*)) 
print (demo (*b')) 


上 面 的 函数 使 用 列表 作为 默认 参数 ,由 于 其 可 记忆 性 ,连续 多 次 调用 该 函数 而 不 给 该 
参数 传 值 时 ,再 次 调用 时 将 保留 上 一 次 调用 的 结果 ,从 而 导致 很 难 发 现 的 错误 。 下 面 的 代 
码 就 不 存在 这 个 问题 : 


def demo (newitem, old list- None) : 
if old list is None: 
old list- [] 
old list.append (newitem) 
retum old list 


2. 关键 参数 
关键 参数 主要 指 调用 卫 数 时 的 参数 传递 方式 ,与 函数 定义 无 关 。 通 过 关键 参数 可 以 


按 参 数 名 字 传 递 值 , 实 参 顺 序 可 以 和 形 参 顺 序 不 一 致 ,但 不 影响 参数 值 的 传递 结果 ,避免 
了 用 户 需要 牢记 参数 位 置 和 顺序 的 麻烦 ,使 得 函数 的 调用 和 参数 传递 更 加 灵活 方便 。 


>>> def demo(a, b, c- 5): 
print (a, b, c) 

»»»dem(, 7) 

375 

»»»dem(a-7, b-3, c- 6) 
736 

»»»dem(c-8, a- 9, b- 0) 
908 


3. 可 变 长 度 参数 


可 变 长 度 参数 在 定义 函数 时 主要 有 两 种 形式 : * parameter 和 xxparameter, 前 者 用 
来 接收 任意 多 个 实 参 并 将 其 放 在 一 个 元 组 中 .后 者 接收 类 似 于 关键 参数 一 样 显 式 赋值 形 
式 的 多 个 实 参 并 将 其 放 入 字典 中 。 

下 面 的 代码 演示 了 第 一 种 形式 可 变 长 度 参 数 的 用 法 , 即 无 论调 用 该 函数 时 传递 了 多 
少 实 参 ,一 律 将 其 放 入 元 组 中 : 


>>> def dam(* p): 
Print (p) 
>>>dem(, 2, 3) 

Q, 2, 3) 
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»»»deo(, 2, 3, 4, 5, 6, 7) 
Q, 2, 3, 4, 5, 6, 7) 


下 面 的 代码 演示 了 第 二 种 形式 可 变 长 度 参数 的 用 法 , 即 在 调用 该 函数 时 自动 将 接收 
的 参数 转换 为 字典 : 


>>>def dem (**p) : 
for item in p.items(): 
print (item) 
>>> dem (二 1 y-2, z-3) 
yr, 2) 
('x', 1) 
(z 3) 


$e EX. Python 定义 函数 时 可 以 同时 使 用 位 置 参 数 、 关 键 参 数 、 默 认 值 参数 和 可 变 
长 度 参 数 , 但 是 除非 真 的 很 必要 ,否则 请 不 要 这 样 用 ,因为 这 会 使 得 代码 非常 混乱 而 严重 
降低 可 读 性 ,并 导致 程序 查 错 非常 困难 。 另 外 ,一 般 而 言 ,一 个 函数 如 果 可 以 接收 很 多 不 
同类 型 参数 的 话 , 很 可 能 是 函数 设计 得 不 好 ,例如 函数 功能 过 多 ,需要 进行 必要 的 拆 分 和 
重新 设计 ,以 满足 模块 高 内 聚 的 要 求 。 


4. 传递 参数 时 的 序列 解 包 


调用 含有 多 个 参数 的 函数 时 ,可 以 使 用 Python 列表 、 元 组 、 集 合 . 字 典 以 及 其 他 可 和 迭 
代 对 象 作为 实 参 ,并 在 实 参 名 称 前 加 一 个 星 号 ,Python 解释 器 将 自动 进行 解 包 ,然后 传递 
给 多 个 单 变量 形 参 。 


>>> def demp(a, b，c) : 
print (at bt c) 

»»»ser- [1, 2, 3] 

>>> dem(# seg) 

6 

>>>tup= (1, 2, 3) 

»»»dem(* tup) 

6 

»»»dic- (1:'a', 2:'b', 3:'c') 

»»»dem(* dic) 

6 

>>> Set= {1, 2, 3) 

»»»dem(* Set) 

6 

>>>dem(x dic.values()) 

abc 


AMER: 四 字典 对 象 作为 实 参 时 默认 使 用 字典 的 “ 键 ”, 如 果 需 要 将 字典 中 “ 键 : 
值 ”" 元 素 作为 参数 则 需要 使 用 items() 方 法 明确 说 明 , 如 果 需 要 将 字典 的 “ 值 ” 作 为 参数 则 
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需要 调用 字典 的 values() 方 法 明确 说 明 ; 加 实 参 中 元 素 个 数 与 形 参 个 数 必 须 相 等 ,否则 
将 出 现 错误 。 


您 注意 : 调用 函数 时 如 果 对 实 参 使 用 一 个 星 号 ( * ) 进 行 序列 解 包 , 这 么 这 些 解 包 后 


的 实 参 将 会 被 当 作 普通 位 置 参数 对 待 , 并 且 会 在 关键 参数 和 使 用 两 个 星 号 (xx) 进 行 序列 
解 包 的 参数 之 前 进行 处 理 。 


>>> def damla, b, c): # 定 义 函 数 
print(a, b, c) 
»»»dmo(* (l, 2, 3) # 调 用 ,序列 解 包 
123 
>>>dem(l * (2, 3) # 位 置 参数 和 序列 解 包 同时 使 用 
123 
»»»dmo(, * (2,), 3) 
123 
»»»deo(a-l, * (2, 3)) # 序 列 解 包 相 当 于 位 置 参数 ,优先 处 理 
Traceback (most. recent. call last): 
File "«pyshellf26» ", line 1, in «module» 
demo (a-1, * (2, 3) 
TypeError: demo ()got multiple values for argument 'a" 
»»»dmo(p-1, * (2, 3)) 
Traceback (most. recent call last): 
File "«pyshell£27» ", line 1, in < module» 
dem(b-1, * (2, 3) 
TypeError: demo ()got multiple values for argument 'b' 
»»»demo(c-l, * (2, 3)) 
237 
»»»de(**('a':l, 'b':2), * (3,)) # 序 列 解 包 不 能 在 关键 参数 解 包 之 后 
SyntaxError: iterable argument unpacking follows keyword argument unpacking 
»»»dem(* (3), **('a':1, 'b':2)) 
Traceback (most recent call last): 
File "«pyshellf30» ", line 1, in «module» 
demo(* (3,), ** ('a':1, 'b':2)) 
TypeError: demo ()got multiple values for argument 'a' 
»»»dem(* (3,), **('c':1, 'b':2)) 
321 


333 变量 作用 域 


变量 起 作用 的 代码 范围 称 为 变量 的 作用 域 , 不 同 作用 域内 同名 变量 之 间 互 不 影响 ,就 


像 不 同文 件 夹 的 同名 文件 之 间 互 不 影响 一 样 。 一 个 变量 在 函数 外 部 定义 和 在 函数 内 部 定 
XL ,其 作用 域 是 不 同 的 ,函数 内 部 定义 的 变量 一 般 为 局 部 变量 ,在 函数 外 部 定义 的 变量 为 
全 局 变量 。 


在 函数 内 定义 的 普通 变量 只 在 该 函数 内 起 作用 , 当 函 数 运行 结束 后 ,在 其 内 部 定义 的 
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局 部 变量 将 被 自动 删除 而 不 可 访问 。 在 函数 内 部 定义 的 全 局 变量 当 函 数 结束 以 后 仍然 存 
在 并 且 可 以 访问 。 

如 果 想 要 在 函数 内 部 修改 一 个 定义 在 函数 外 的 变量 值 ,那么 这 个 变量 就 不 能 是 局 部 
的 ,其 作用 域 必须 为 全 局 的 。 可 以 在 函数 内 部 通过 global 关键 字 来 声明 或 定义 全 局 变 
量 , 这 分 两 种 情况 : 

(1) 一 个 变量 已 在 函数 外 定义 ,如 果 在 函数 内 需要 修改 这 个 变量 的 值 ,并 将 这 个 赋 
值 结果 反映 到 函数 之 外 ,可 以 在 函数 内 用 global 明确 声明 要 使 用 已 定义 的 同名 全 局 
变量 。 

(2) 在 函数 内 部 直接 使 用 global 关键 字 将 一 个 变量 声明 为 全 局 变量 ,如 果 在 函数 外 
没有 定义 该 全 局 变量 ,在 调用 这 个 函数 之 后 ,会 自动 增加 新 的 全 局 变量 。 

或 者 说 ,也 可 以 这 么 理解 : 四 在 函数 内 如 果 只 引用 某 个 变量 的 值 而 没有 为 其 赋 新 值 ， 
该 变量 为 ( 隐 式 的 ) 全 局 变量 ; @ 如 果 在 函数 内 任意 位 置 有 为 变量 赋值 的 操作 ,该 变量 即 
被 认为 是 ( 隐 式 的 ) 局 部 变量 ,除非 在 函数 内 显 式 地 用 关键 字 global 进行 声明 。 

下 面 的 代码 演示 了 局 部 变量 和 全 局 变量 的 用 法 。 


>>> def dam(): 
global x # 声 明 或 创建 全 局 变量 
x-3 # 修 改 全 局 变量 的 值 
y-4 # 局 部 变量 
print(x, y) 
»»»x-5 # 在 函数 外 部 定义 了 全 局 变量 x 
>>>dem() # 本 次 调用 修改 了 全 局 变量 x 的 值 
3 4 
>>>x 
3 
>>>y # 局 部 变量 在 函数 运行 结束 之 后 自动 删除 


Traceback (most. recent. call last): 
File "«pyshellfll»", line 1, in «module» 
y 
NameError: name 'y' is not defined 
>>>delx # 删 除了 全 局 变量 x 
>>>x 
Traceback (most recent call last): 
File "«pyshellél? ", line 1, in «module» 
x 
NameError: name 'x' is not defined 
>>> dam!() # 本 次 调用 创建 了 全 局 变量 
3a 
>>>x 
3 
>>>y # 局 部 变量 在 函数 调用 结束 后 自动 删除 


Traceback (most. recent call last): 
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File "<pyshell#11>", line 1, in «module» 
y 
NameError: name 'y' is not defined 
如 果 局 部 变量 与 全 局 变量 具有 相同 的 名 字 , 那 么 该 局 部 变量 会 在 自己 的 作用 域内 隐 
藏 同名 的 全 局 变量 ,例如 下 面 的 代码 所 演示 。 


>>>def dem(): 
x-3 # 创 建 了 局 部 变量 ,并 自动 隐藏 了 同名 的 全 局 变量 
print (x) 

»»»x-5 # 创 建 全 局 变量 

>>>x 

5 

»»»dem() 

3 

>>>x # 函 数 调用 结束 后 ,不 影响 全 局 变量 x 的 值 


5 

最 后 ,如 果 需 要 在 同一 个 程序 的 不 同 模块 之 间 共享 全 局 变量 ,可 以 编写 一 个 专门 的 模 
块 来 实现 这 一 目的 。 例 如 ,假设 在 模块 A. py 中 有 如 下 变量 定义 : 

glcbal variable- 0 
而 在 模块 B. py 中 使 用 以 下 语句 修改 该 全 局 变量 的 值 : 

import A 

A.glcbal variable- 1 
在 模块 C. py 中 使 用 以 下 语句 来 访问 全 局 变量 的 值 : 

import A 

print(A.glcbal variable) 


从 而 实现 了 在 不 同 模块 之 间 共 享 全 局 变量 的 目的 。 


代码 可 读 性 ,并 使 得 代码 测试 和 纠 错 变 得 很 困难 。 

(以 拓展 知识 : 局 部 变量 的 空间 是 在 栈 上 分 配 的 ,而 栈 空间 是 由 操作 系统 维护 的 ,每 
当 调 用 一 个 函数 时 ,操作 系统 会 为 其 分 配 一 个 栈 帧 ,函数 调用 结束 后 立刻 释放 这 个 栈 帧 。 
因此 ,函数 调用 结束 后 ,该 函数 内 部 所 有 的 局 部 变量 都 不 再 存在 。 

(QARAR: 除了 局 部 变量 和 全 局 变量 ,Python 还 支持 使 用 nonlocal 关键 字 定 义 
一 种 介 于 两 者 之 间 的 变量 。 例 如 下 面 的 代码 : 

def scope test(): 


def do local (): 
spen 哦 是 局 部 变量 " 
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def do nonlocal(): 
nonlocal spam # 这 时 要 求 spam 必 须 是 已 存在 的 变量 
spem- " 哦 不 是 局 部 变量 ,也 不 是 全 局 变量 " 


def do glcbal (): 
glcbal spem # 如 果 全 局 作用 域内 没有 spam, 就 自动 新 建 一 个 
spame "f J& 4 Je 2E ov 


spam- "原来 的 值 " 

do local() 

print ("局 部 变量 赋值 后 :"，spam) 
do nonlocal() 

print ("nonlocal AF fit RE (f JR :", spem) 
do glcbal() 
print(" 全 局 变量 赋值 后 "，spam) 


soe test() 
print("4t Jg) 2E :", spem) 


上 面 的 代码 运行 结果 为 


局 部 变量 赋值 后 : 原来 的 值 

nonlocal 变量 赋值 后 : 我 不 是 局 部 变量 ,也 不 是 全 局 变量 
全 局 变量 赋值 后 我 不 是 局 部 变量 ,也 不 是 全 局 变量 

全 局 变量 : 我 是 全 局 变量 


334 lambda 表达 式 
lambda 表达 式 常用 来 声明 匿名 函数 , 即 没有 函数 名 字 的 临时 使 用 的 小 函数 ,例如 第 


2 章 中 列表 对 象 的 sort 〇 方法 以 及 内 置 函 数 sorted() 中 的 key 参数 。lambda 表达 式 只 可 
以 包含 一 个 表达 式 ,不 允许 包含 其 他 复杂 的 语句 ,但 在 表达 式 中 可 以 调用 其 他 函数 ,并 支 


了 不 同情 况 下 lambda 表达 式 的 应 用 。 


»»»f-lanbdax, y, z: xt ytz 


»»»print(f(, 2, 3) HE larbda 表达 式 当 作 函 数 使 用 
6 

»»»g-labda x, y-2, z-3: xtytz # 含 有 默认 值 参数 
»»»print(g(1)) 

6 

»»»print(gQ, z-4, y- 5) # 调 用 时 使 用 关键 参数 

n 


»»»I- [üambda x: x**2), (lanbda x: x**3), (lambda x: x**4)] 
»»»print(L[0] (2), L[1] (2), ED] (2)) 
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4816 
»»»D-('fl': (lambda: 2€ 3), 'f2': (labda: 2* 3), '£3': (lanbda: %*3)} 
»»»print(D['£1'] 0, DI'£2] 0, DI'£3'10) 
568 
»»»I-[l 2, 3, 4, 5] 
»»»print (rep((lanbda x: x* 10), L)) # 没 有 名 字 的 lambda 表达 式 ,作为 函数 参数 
[, 12, 13, 14, 15] 
>>>L 
[1, 2, 3, 4, 5] 
>>> def dem(n): 
retum nx n 
>>>dem(5) 
25 
>>>a list- [1, 2, 3, 4, 5] 
»»»mep(lanbda x: dem (x), a list) # 在 lanbda 表达 式 中 调用 函数 
1, 4, 9, 16, 25] 
>>> data- list (range (20) ) 
»»» print (data) 
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19] 
>>> import randam 
>>> randm. shuffle (data) 


>>>data 

4, 3, 11, 13, 12, 15, 9, 2, 10, 6, 19, 18, 14, 8, 0, 7, 5, 17, 1, 16] 

>>> data.sort (key- lambda x: x) # 用 在 列表 的 sort() 方 法 中 ,作为 函数 参数 
»»»data 

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19] 

>>> data.sort (key- lenbra x: len(str (x))) HEH larbca 表达 式 指定 排序 规则 

>>> data 


0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 22, 13, 14, 15, 16, 17, 18, 19] 
>>> data.sort (key= lambda x: len(str(x)), reverse- True) 

>>> data 

10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


ÈE: 在 使 用 lambda 表达 式 时 ,要 注意 变量 作用 域 可 能 会 带 来 的 问题 ,例如 ,下 
面 的 代码 中 变量 x 是 在 外 部 作用 域 中 定义 的 ,对 lambda 表达 式 而 言 不 是 局 部 变量 ,从 而 
导致 出 现 了 错误 。 


»»»r-[l 

»»»forxinrange(10): 
r.append (lanbda: x**2) 

»»»rl0]0 

81 

»»»rlll0ü 

81 
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>>>r[2]() 
81 


而 修改 为 下 面 的 代码 , 则 可 以 得 到 正确 的 结果 。 


»»»r-[] 

>>> for x in range(10): 
r.append(lanbda r= x: n**2) 

>>> r[0]() 

0 

»»»rl[ll0 

D 

»»»r[5]0 

25 

»»»r[8]10 

64 


335 案例 精 选 
例 3-15 编写 函数 计算 圆 的 面积 。 


fra math import pi as PI 
def CircleArea (r) : 
if isinstance(r, (int, float): # 确 保 接收 的 参数 为 数值 
retum PI* r* r 
else: 
print ('You must give me an integer or float as radius.') 
print (CircleArea (3)) 
fi 3-16 编写 函数 ,接收 任意 多 个 实数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 所 有 参数 
的 平均 值 ,其 他 元 素 为 所 有 参数 中 大 于 平均 值 的 实数 。 


def demo(* para): 


avg- sun(para) / len (para) # 平 均值 
g- [i for i in para if i» avg] # 列 表 推 导 式 
return (avg, )+ tuple (g) 


print (demo (1, 2, 3, 4)) 


例 3-17 编写 函数 ,接收 字符 串 参 数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 大 写字 母 的 
个 数 ,第 二 个 元 素 为 小 写字 母 的 个 数 。 
def demo (5) : 
result= [0, 0] 


for ch in s: 
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if 'a'x<=dx='z": 
result[1] +=1 
elif 'a'c-dxc- "z*: 
result[0] +=1 

return result 


print (demo ('aaaabbbbc'")) 


AMER: 上 面 代码 中 使 用 关系 运算 符 判 断 一 个 字符 是 否 为 大 写字 母 或 小 写字 母 ， 
只 是 为 了 演示 一 种 用 法 ,在 实际 开发 中 还 是 建议 使 用 字符 串 对 象 自身 提供 的 isupper() 和 
islower() 方 法 ,这 样 速度 会 更 快 一 些 。 
例 3-18 编写 函数 ,接收 包含 20 个 整数 的 列表 st 和 一 个 整数 k 作为 参数 ,返回 新 列 
表 。 处 理 规则 : 将 列表 Ist H FER k 之 前 的 元 素 逆序 ,下 标 k 之 后 的 元 素 逆序 ,然后 将 整 
个 列表 lst 中 的 所 有 元 素 逆序 。 
def demo (1st, k): 
x-lst[:k] 
x.reverse() 
y-lst[k:] 
y.reverse() 
r-xty 


lst= list (range (1, 21)) 
print (1st) 
print (demo (1st, 5)) 
(QERAR: 061 3-18 描述 的 实际 上 是 将 列表 循环 左 移 Kk 位 的 算法 ,下 面 的 代码 使 
用 了 更 加 直接 的 方法 ,但 对 于 长 列表 来 说 效率 远 不 如 上 面 的 代码 高 , 比 下 面 小 技巧 中 提 到 
的 方法 更 是 相差 很 多 。 
def demo(1st, k): 
temp- 1st[:] 
for iin range(k): 
temp.append (temp.pop (0) ) 
return temp 
POED.: 对 于 本 例 中 描述 的 问题 ,使 用 切片 可 以 直接 实现 ,可 以 达到 最 快 的 
RE. 
def demo (Ist, k): 


retum lst[k:]* 1st [:k] 


例 3-19 — 5/73 AR, ER t, 返 回 斐 波 那 契 数列 中 大 于 t 的 第 一 个 数 。 
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def deno (t) : 
a, b-1,1 
while bct: 
a, b-b, atb 
else: 
retum b 


print (demo (50)) 


103-20 编写 函数 ,接收 一 个 包含 若干 整数 的 列表 参数 lst, 返 回 一 个 元 组 ,其 中 第 一 
个 元 素 为 列表 lst 中 的 最 小 值 ,其余 元 素 为 最 小 值 在 列表 lst 中 的 下 标 。 


import randm 


def demo (1st): 
memin (1st) 
result = (m) 
positions- [index for index, value in enumerate (1st)if value- —m] 
result- result tuple (positions) 
return result 


x= [randam.randint(l, 20)for i in range(50)] 

print (x) 

print (demo (x) ) 

例 3-21 编写 函数 ,接收 一 个 整数 t 为 参数 ,打印 杨辉 三 角 前 t+ 行 。 


def demo(t) : 

result- [(1], (1, 1]] 

line- [1, 1] 

foriinrangeQ, t): 
rl 
for j in range(0, len(line)- 1): 

r.append (line[j]+ line[j+ 1]) 

line- [1] r+ [1] 
result.append (line) 

return result 


df output (result) : 
for item in result: 


print (item) 


output (demo (10) ) 
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n, 2, 1] 
0,3, 3,1] 

L, 4, 6 4, 1] 

L1, 5, 10, 10, 5, 1] 

D, 6, 15, 20, 15, 6, 1] 

D, 7, 21, 35, 35, 21, 7, 1] 

[1, 8, 28, 56, 70, 56, 28, 8, 1] 

[1, 9, 36, 84, 126, 126, 84, 36, 9, 1] 


例 3-22 编写 函数 ,接收 一 个 正 偶数 为 参数 ,输出 两 个 素数 ,并 且 这 两 个 素数 之 和 等 
于 原来 的 正 偶数 。 如 果 存 在 多 组 符合 条 件 的 素数 , 则 全 部 输出 。 


import math 


def IsPrime (n): 
me int (math.sqrt (n))+ 1 
for i in range(2, m): 
if n$i--0: 
return False 
return True 


def demo (n) : 
if isinstance(n, int)and n» 0 and n$2- — 0: 
for i in range(3, int(n/2)* 1): 
if i$2--1 and IsPrime (i)and IsPrime (n- i): 


print(ü, +', mi, '-', n) 


demo (60) 


例 3-23 编写 函数 ,接收 两 个 正 整 数 作 为 参数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 最 
大 公约 数 , 第 二 个 元 素 为 最 小 公 倍数 。 


def demo (m, n): 

if æn: 
m mn, m 

pm* n 

while m!=0: 
rnm 
mm 
mr 


retum(n, int(p/n)) 


print (demo (20, 30)) 
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QARMA: Python 标准 库 fractions 中 提供 了 gcd() 函 数 用 来 计算 最 大 公约 数 ， 
在 Python 3. 5 版 本 中 ,标准 库 math 也 提供 了 计算 最 大 公约 数 的 函数 gcd()。 利 用 gcd() 
函数 ,上 面 的 代码 也 可 以 写作 : 


def demm n): 
import math 
r-math.god (m,n) 
retum(r, int(m* n/r)) 


例 3-24 编写 函数 ,接收 一 个 所 有 元 素 值 都 不 相等 的 整数 列表 x 和 一 个 整数 n, 要 求 
将 值 为 n 的 元 素 作 为 支点 ,将 列表 中 所 有 值 小 于 n 的 元 素 全 部 放 到 n 的 前 面 ,所 有 值 大 于 
n 的 元 素 放 到 n 的 后 面 。 


import randcm 


def demo (x, n): 
ifnnotinx: 
print(n, ' is not an element of ', x) 
retum 


i=x.indx(n) # 获 取 指 定 元 素 在 列表 中 的 索引 
x[0], x[ij-x[i], x[0] # 将 指定 元 素 与 第 0 个 元 素 交换 
key- x[0] 


i-0 
j=len(x)-1 
while i<j: 
while i<j and x[j]>= key: # 从 后 向 前 寻找 第 一 个 比 指定 元 素 小 的 元 素 
j-=1 
x[i]=x[j] 


while i<j and x[i]<= key: # 从 前 向 后 寻找 第 一 个 比 指定 元 素 大 的 元 素 
i+=1 


x[j]=x[i] 
x[i]=key 


x -list(range(1, 10)) 

randcm.shuffle (x) # 将 元 素 打 乱 顺序 
print (x) 

demo (x, 4) 

print (x) 


(QARAR: 例 3-24 给 出 的 算法 是 快速 排序 算法 中 非常 重要 的 一 个 步骤 ,当然 也 
可 以 使 用 下 面 更 加 简洁 的 代码 来 实现 。 
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>>> inport randm 
>>>def dem(x, n): 
tl= [i for i in x if i«n] 
t2- [i for i inx if i»n] 
retum tl+ [n] t2 
>>> list (range (1,10) ) 
>>> randm.shuffle (x) 
>>>x 
[1, 9, 3, 6 5,2, 4, 7, 8 
>>>demlx, 4) 
[1, 3, 2, 4, 9, 6, 5, 7, 8] 


fi 3-25 编写 函数 ,计算 字符 串 匹 配 的 准确 率 。 
以 打字 练习 程序 为 例 , 假 设 origin 为 原始 内 容 ,userInput 为 用 户 输 入 的 内 容 , 下 面 的 
代码 用 来 测试 用 户 输入 的 准确 率 。 


def Rate (origin, userInput): 
if not (isinstance (origin, str)and isinstance (userInput, str)): 
print ("The two parameters must be strings.') 
retum 
if len(origin)« len (userInput) : 
print('Sorry. I suppose the second parameter string is shorter.') 
retum 
ridht-0 # 精 确 匹 配 的 字符 个 数 
for origin char, user char in zip(origin, userInput): 
if origin char--user char: 
right 4-1 
return right/len (origin) 


origin- 'Shandong Institute of Business and Technology" 
userInput- 'ShanDong institute of business and technolog' 
print (Rate (origin, userInput)) # 输 出 测试 结果 


例 3-26 编写 函数 ,对 整数 进行 因数 分 解 。 


fram randcm import randint 
frammath import sqrt 


def factoring(n): 
"'"' 对 大 数 进行 因数 分 解 '"' 
if not isinstance(n, int): 
print ('You must give me an integer!) 
retum 
# 开 始 分 解 , 把 所 有 因数 都 添加 到 result 列表 中 


result- [] 
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for p in primes: 
while n!'- 1: 
if n&p--0: 
n-n/p 
result.append(p) 
else: 
break 
else: 
result-map(str, result) 
result- ' * '.join(result) 
return result 
# 考 虑 参数 本 身 就 是 素数 的 情况 
if not result: 
retum n 


testData- [randint(10, 100000)for i in range (50)] 
# 随 机 数 中 的 最 大 数 

maxData= max (testData) 

# 小 于 mexpata 的 所 有 素数 


primes- [p for p in range (2, maxData)if 0 not in [ pèd for d in range 2, int(sart(p))* 1)] ] 


for data in testData: 
r= factoring (data) 
print(data, '=', r) 
# 测 试 分 解 结 果 是 否 正确 
print (data= — eval (r)) 


例 3-27 韩信 点 兵 。 


昔 信 为 了 不 让 敌人 知道 自己 的 兵力 有 多 少 , 让 士兵 报 数 时 先 从 1 至 3 报 数 ,再 从 1 至 
5 重新 报 数 ,然后 再 从 1 至 7 重新 报 数 ,只 需要 记 下 最 后 一 名 士兵 每 次 报 数 是 几 , 即 可 快 


速 计算 出 自己 有 多 少 士兵 。 


fram functools import reduce 
fram math import god 


def isCoPrime(p): 


"判断 p 中 每 个 元 组 的 第 1 个 数 即 wi) 之 间 是 否 互 素 '"' 


for index, iteml in enumerate (p) : 
for item? in p[indext 1:]: 
if god(iteml[0], item[0]) !=1: 
return False 
return True 


def extEuclid(Mi, mi): 
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""'" 暴 力 穷 举 , 求 Mi Xt mi REAT, ui nr VL GE HH EKLE GA A ERE nnn 
for i in range(l, mi): 
if i* Mi &mi --1: 
return i 


def chineseRemainder (p) : 
"PIG 2, C, D, 03, 9), wi, ai)… ESCAS Korn 3/7/B 为 商 ,3/15 为 余数 '"' 
# 先 判断 所 给 数据 中 的 mi 是否 互 素 ,如 果 不 是 则 提示 数据 错误 并 退出 
if not isCoPrime (p) : 
return 'Data error." 
# 切 片 浅 复制 ,临时 变量 ,防止 修改 实 参 中 的 数据 
EP[:] 
PR Mm * n2* n3* … * m 
EEP= [item[0] for item in pp] 
M= reduce (lambda x,y: x* y, ppp) 
for index, item in enumerate (pp) : 
Mi= int (M/item[0]) 
bi-extEuclid(Mi, item[0]) 
polindex]- item (Mi, bi) 
# 求 解 最 终结 果 ,sum(ai* bi x Mi)md M 
result- sum([item[1] * item[2] * item[3] for item in pp]) 
result- result $M 
# 考 虑 特殊 情况 ,不 允许 结果 为 1 
if result==1: 
result- result+M 
return result 


data- [[(,2), (5,3), 7,2)], 
[(5,1), (3,2)], 
[(5,1), (3,1)], 
[(5,4), (3,2)], 
[(7,2), 6,4), (9,3)], 
[(5,2), (6,4), 0,4)], 
[(3,2),(5,3), 0,4)]] 
for p in data: 
print(p) 
print (chineseRemainder (p) ) 


作为 一 种 练习 ,也 可 以 用 暴力 枚 举 法 求解 韩信 和 点 兵 的 问题 。 例 如 : 


def chineseRemainder (p) : 
""p3 UG, 2, C, 2), 03, 5, …] 形 式 的 参数 ,其 中 3/7/13 为 商 ,2/1/5 为 余数 ''' 
# 检 查 数据 是 否 合法 , 若 有 相同 商 对 应 不 同 余数 则 认为 给 的 数据 不 合法 
for indexl, pairl in enmerate (p) : 
for pair? in p[indexl+ 1:]: 
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if pairl[0]-—pair?[0] and pairl[1]!—pair?[1]: 
print (*Data Error.) 
retum 
# 对 给 定数 据 按 商 从 大 到 小 排序 
Er sorted (p, key- lanbda x:x[0], reverse- True) 
# 生 成 谋 套 列表 
possibleValues- list (map (lambda x: list((i* x[0]* x[1] for i in range (1,10000))), p)) 
# 寻 找 第 一 个 共同 包含 的 数 ,该 数 即 符合 条 件 的 最 小 数 
for value in possibleValues[0] : 
flag True 
for rest in possibleValues[1:]: 
if value not in rest: 
flag- False 


print ('Can not find a number') 


P= [[(5,3), (9,3), 03,3, 07,3], 
[(9,7), 6,2), (4,3)], 
[(3,2), 6,3), (0,2)], 
[(3,2), (4,1)], 
[(2,1), 6,3, (5,2), (7,3), (9,4)], 
[(2,1), (3,2), (5,4), (6,5), (7,0)]] 
for pp in p: 
chineseRemainder (pp) 
例 3-28 模拟 发 红包 算法 。 
据说 这 世间 没 哈 问题 是 一 个 红包 解决 不 了 的 ,如 果 有 , 那 就 两 个 红包 。 微 信 红包 不 仅 
是 好 朋友 之 间 沟 通 感情 的 方式 ,也 是 情侣 之 间 在 结婚 纪念 日 .生日 等 重要 日 期 表达 爱 意 的 
形式 ,还 是 一 种 比较 流行 的 交易 手段 。 随 着 微 信 红包 的 流行 ,还 出 现 了 很 多 好 玩 的 表情 
( 见 图 3-7) 和 段子 ,亲朋 好 友之 间 偶 尔 玩 玩 挺 好 的 。 当 然 , 也 有 人 因为 玩 红包 游戏 而 倾 家 
荡 产 ,下 面 的 代码 将 为 大 家 揭秘 如 何 控 制 红包 金额 的 分 配 。 


import randam 


def hongbao (total, num): 
total 表示 拟 发 红包 总 金额 
#mm 表 示 拟 发 红包 数量 
eade [] 
# 已 发 红包 总 金额 
already=0 
for i in range(l, num): 
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# 为 当前 抢 红包 的 人 随机 分 配 金额 
# 至 少 给 剩 下 的 人 每 人 留 一 分 钱 
t= randm.randint (1, (total- already)- (num- i)) 
each.append(t) 
already- already t 
# 剩 余 所 有 钱 发 给 最 后 一 个 人 
each.append(total- already) 
return each 


num-5 

# 模 拟 30 次 

for i in range(30): 
each hongbao (total, num) 
print (each) 


AMER: 通过 修改 代码 可 以 控制 红包 分 配 的 规律 ,然后 就 可 以 大 致 控制 每 个 人 
领取 的 钱 数 。 


eI S gu 


1 $0.01 公分 


图 3-7 几 个 好 玩 的 表情 


B 3-29 编写 函数 ,将 YYYY-MM-DD 的 日 期 形式 转换 为 YYYYQ 的 形式 ,其 中 Q 
表示 季度 。 
def convert (YearMonthDay) : 
if not isinstance (YearMonthDsy, str): 
return "Type Error. Mist be str" 
if YearMonthDay.count ('- ') !=2: 
return 'Parameter Error. Must contains 2 - " 
data= YearMonthDay.split('- ") 
ifQen(data[0]) != 4) (len (data[1]) not. in(1, 2))or en (ata[2]) not in(1, 2)): 
return 'Parameter Error. Must be YYYY- M+ DD" 
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try: 
year, month, day-mep(int, data) 
quarter- [[3, 4, 5l, [6, 7, 8), [9, 10, 11], [12, 1, 2]] 
for q m in enmerate (quarter) : 
if month in m: 
return str (year) * str (q+ 1) 
exoept: 
return 'Parameter Error. Must be YYYY- M+- DD, and all be digits" 


print (convert ('2016- a9- 27")) 


903-30 ”模拟 一 维 信号 卷 积 , 并 模拟 整数 乘法 。 

在 数字 信号 处 理 中 经 常会 用 到 卷 积 计算 ,例如 各 种 滤波 器 的 设计 。 两 个 序列 的 卷 积 
计算 大 体 需要 3 步 : 翻转 其 中 一 个 序列 ; @ 移 动 翻转 后 的 序列 ,并 计算 每 次 移动 后 两 个 
序列 的 重 倒 面积; @ 重 复 第 @ 步 ,直至 两 个 序列 没有 重 伙 部 分 。 假 设 一 个 序列 为 [1, 2, 
3] , 另 一 个 序列 为 [4, 5], 这 两 个 序列 的 卷 积 计算 步 又 如 图 3-8 所 示 。 

除了 滤波 器 设计 ,一 维 序列 卷 积 还 可 以 用 来 计算 大 整数 乘法 和 多 项 式 乘法 ,下 面 的 代 
码 以 大 整数 乘法 来 演示 其 用 法 ,当然 在 Python 中 大 整数 的 乘法 直接 计算 即 可 。 首 先 需 
要 把 大 整数 使 用 列表 来 表示 ,列表 中 的 每 个 元 素 用 来 表示 大 整数 中 的 一 位 数字 ,例如 , 数 
字 123 表示 为 [1, 2,，3] ,数字 45 表示 为 [4, 5], 使 用 卷 积 计 算得 到 结果 为 [4，13，22， 
15] ,把 卷 积 结果 转换 为 数字 5535 的 步骤 和 原理 如 图 3-9 所 示 , 图 中 中 间 一 排 数 字 表 示 进 
位 ,最 下 面 一 排 数 字 表 示 第 一 排 数字 加 上 进位 以 后 对 10 的 余数 。 


123 321 321 321 324 
45 = i pm ji = " 一 f 4 13 2 15 
4 i3 12410 15 M N YI 
iv 5 5 3 5 

图 3-8 一 维 序列 卷 积 计算 原理 示意 图 图 3-9 把 卷 积 结果 转换 为 数字 


def coonv (lstl, 1st2): 
""' 用 来 计算 两 个 列表 所 表示 的 信号 的 卷 积 , 返 回 一 个 列表 '"" 
result= [] 
# 翻 转 第 一 个 列表 
lstl.reverse|() 
lengthl- len (1st1) 
length2- len (1st2) 
# 移 动 翻转 后 的 第 一 个 列表 ,直到 "完全 移 人 " 
for i in range(l, lengthl* 1): 
t- 1stl[lengthl- i:] 
HAERA" 


v-sum((iteml* item? for iteml, item? in zip(t,lst2))) 
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result .append (v) 
# 继 续 移动 翻转 后 的 第 一 个 列表 ,直到 "完全 移出 " 
for i inrange(l, length2) : 
t-1st?[i:] 
v-sum((iteml* item? for iteml, item? in zip(lstl,t))) 
result.append (v) 
return result 


def mil (lst) : 
"把 列表 中 的 数字 转换 为 普通 整数 的 形式 …" 
result- '' 
c-0 
for item in 1st[::- 1]: 
item- item c 
# 计 算 当 前 位 的 余数 和 向 前 一 位 进位 的 数字 
n, c-str(item$10), item //10 
# 使 用 字符 串 记录 临时 结果 
result +=n 
ifc: 
result += str (c) 
return eval (result[::- 1]) 


def main(numl, num2): 
lstl= list tmap (int, str(numl))) 
1st2-list(map(nt, str (num2))) 
result- conv (lstl, lst2) 
print (mil (result)- — nml * nm?) 


fram randcm import randint 

for i in range (100) : 
numl- randint (1, 99999999) 
num2- randint (1, 99999999999) 
main (numl, num2) 


例 3-31 猜 数 游戏 。 系 统 随 机 产生 一 个 数 , 玩 家 最 多 可 以 猜 5 次 ,系统 会 根据 玩家 的 
猜测 进行 提示 ,玩家 则 可 以 根据 系统 的 提示 对 下 一 次 的 猜测 进行 适当 调整 。 


fram randcm import randint 


def guess) : 
# 随 机 生成 一 个 整数 
value= randint (1,1000) 
# 最 多 允许 猜 5 次 
mexTimes- 5 
for iin rang (naxTimes) : 
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prampt- 'Start to GUESS:' if i-— 0 else 'Guess again:' 
# 使 用 异常 处 理 结构 ,防止 输入 不 是 数字 的 情况 
try: 
x= int (input prompt)) 
PENT 
ifx--value: 
print ('Congratulations!') 
break 
elif x» value: 
print ('Too big') 
else: 
print ("Too little') 
exoept: 
print('Mist input an integer between 1 and 999") 
else: 
# 次 数 用 完 还 没 猜 对 ,游戏 结束 ,提示 正确 答案 
print('Game over. FAIL.') 
print("The value is ', value) 


guess () 


例 3-32 计算 形式 如 a 十 aa 十 aaa 十 aaaa 十 … 十 aaa…aaa 的 表达 式 的 值 , 其 中 a 为 小 
于 10 的 自然 数 。 


def demo(v, n): 
assert 0< v< 10, 'v mist between 1 and 9" 
assert type (n)== int, 'n must be integer" 
result, t-0, 0 
for i in range(n): 
t-t* 10v 
result 十 = 七 
return result 


print (demo 3, 4) 


103-33. 有 nn 个 人 围 成 一 圈 , 顺 序 排 号 。 从 第 一 个 人 开始 从 1 到 (假设 4 一 3) 报 数 ， 
报到 的 人 退出 圈子 ,然后 圈子 缩小 ,从 下 一 个 人 继续 游戏 , 问 最 后 留 下 的 是 原来 的 第 


几 号 ? 
fram itertools import cycle 


def demo (1st, k): 
# 切 片 ,以 免 影响 原来 的 数据 
t lst= lst[:] 
# 游 戏 一 直 进 行 到 只 剩 下 最 后 一 个 人 


第 3 章 程序 控制 结构 与 函数 设计 à 117 
e 


while len(t 1st)>1: 
# 创 建 cycle 对 象 
c-cycle(t 1st) 
# 从 1 到 k 报 数 
for i in range(k): 
t-next (c) 
# 一 个 人 出 局 ,圈子 缩小 
index-t lst.index(t) 
t lst-t 1st[indext 1:]+t lst[:index] 
# 测 试用 ,查看 每 次 一 个 人 出 局 之 后 剩余 人 的 编号 
print(t 1st) 
# 游 戏 结束 
return t lst[0] 


lst-list (range (1,11) ) 
print (demo (1st, 3)) 


BI 3-34 汉 诺 塔 问题 。 

据说 古代 有 一 个 焚 塔 , 塔 内 有 3 个 底座 A、B、C,A 座 上 有 64 个 盘子 ,盘子 大 小 不 等 ， 
大 的 在 下 ,小 的 在 上 。 有 一 个 和 尚 想 把 这 64 个 盘子 从 A 座 移 到 C 座 , 但 每 次 只 能 允许 移 
动 一 个 盘子 ,在 移动 盘子 的 过 程 中 可 以 利用 B 座 ,但 任何 时 刻 3 个 座 上 的 盘子 都 必须 始 
终 保 持 大 盘 在 下 .小 盘 在 上 的 顺序 。 如 果 只 有 一 个 盘子 , 则 不 需要 利用 B 座 ,直接 将 盘子 
M A 移 到 C 即 可 。 和 尚 想 知道 这 项 任务 的 详细 移动 步骤 和 顺序 。 这 实际 上 是 一 个 非常 
巨大 的 工程 ,是 一 个 不 可 能 完成 的 任务 。 根 据 数 学 知识 我 们 可 以 知道 ,移动 n 个 盘子 需要 
2735.64 个 盘子 需要 18 446 744 073 709 551 615 步 。 如 果 每 步 需要 一 秒 钟 ,那么 就 需 
要 584 942 417 355 .072 年 。 


def hannuo(num, src, dst, temp- None): 
# 声 明 用 来 记录 移动 次 数 的 变量 为 全 局 变量 
global times 
# 确 认 参 数 类 型 和 范围 
assert type(num)-— int, 'num must be integer" 
assert num» 0, ‘nim must> 0" 
# 只 剩 最 后 或 只 有 一 个 盘子 需要 移动 ,这 也 是 函数 递归 调用 的 结束 条 件 
ifmm--1: 
Print ("The (0) Times move: (1)- —» (2)' .format (times, src, dst)) 
times +=1 
else: 
# 递 归 调 用 函数 自身 ， 
# 先 把 除 最 后 一 个 盘子 之 外 的 所 有 盘子 移 到 临时 柱子 上 
hannuo (num 1, src, temp, dst) 
# 把 最 后 一 个 盘子 直接 移 到 目标 柱子 上 
hannuo(l, src, dst) 


# 把 除 最 后 一 个 盘子 之 外 的 其 他 盘子 从 临时 柱子 上 移 到 目标 柱子 上 
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hannuo (num- 1, temp, dst, src) 

# 用 来 记录 移动 次 数 的 变量 

times-1 

扫 表 示 最 初 放置 盘子 的 柱子 ,c 是 目标 柱子 ,B 是 临时 柱子 

hannuo(3, 'A', 'C', 'B') 

QARR: 函数 递归 调用 。 函 数 的 递归 调用 是 函数 调用 的 一 种 特殊 情况 ,函数 调 
用 自己 ,自己 再 调用 自己 …… 当 某 个 条 件 得 到 满足 时 就 不 再 调用 了 ,最 后 再 一 层 一 层 地 返 
回 直到 该 函数 的 第 一 次 调用 ,如 图 3-10 所 示 。 从 图 中 可 以 看 出 ,每 次 调用 函数 时 必须 要 
记 住 离开 的 位 置 才能 保证 函数 运行 结束 以 后 回 到 正确 的 位 置 , 这 个 过 程 称 为 保存 现场 ,这 
需要 一 定 的 栈 空间 。 因 此 ,递归 深度 如 果 太 深 的 话 , 可 能 会 使 栈 空间 不 足 进而 导致 程序 
LES 

函数 A ”函数 B 。 函数 B MAB 函数 N RAN 


^ un 调用 / | 调用 调用 / | 调用 
m T 
返回 AON j 返回 


图 3-10 ”函数 递归 调用 示意 图 


例 3-35 ”编写 函数 计算 任意 位 数 的 黑洞 数 。 黑 洞 数 是 指 这 样 的 整数 : 由 这 个 数字 每 
位 数字 组 成 的 最 大 数 减 去 每 位 数字 组 成 的 最 小 数 仍 然 得 到 这 个 数 自身 。 例 如 ,3 位 黑洞 
数 是 495 ,因为 954 一 459 一 495,4 位 数字 是 6174, 因 为 7641 一 1467 一 6174。 


def main(n): 

MELSELLILCIIR MOD ERE MEA EM 

# 待 测试 数 范围 的 起 点 和 结束 值 

Start= 10** (n- 1)+2 

end start * 10- 20 

# 依 次 测试 每 个 数 

for i in range(start, end): 
i-str(i) 
# 由 这 几 个 数字 组 成 的 最 大 的 数 
big ''.join(sorted(i, reverse- True) ) 
big- int (big) 
# 由 这 几 个 数字 组 成 的 最 小 的 数 
little ''.join(sorted(i)) 
little- int (little) 
if big little-- int (i): 

print) 
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w4 

main (n) 

这 个 问题 还 有 另外 一 个 计算 方法 ,以 计算 三 位 黑洞 数 为 例 , 任 意 找 一 个 三 位 数 789， 
依次 做 如 下 计算 : 987—879—198 > 981—189— 792 > 972—279—693 ex 
963—369— 594 > 954 一 459 一 495。 按 这 个 思路 可 以 编写 出 下 面 的 代码 ,但 是 如 果 
初始 数字 选取 得 不 合适 ,会 需要 大 量 递归 调用 ,可 能 会 导致 无 法 求解 或 者 栈 溢 出 而 使 程序 
崩溃 。 


def blackHole (n) : 
data- str (n) 
big- sorted(data, reverse- True) 
big-int(''.join(big)) 
little- sorted (data) 
little- int ('' join (little)) 
data- int (data) 
if big- little —— data: 
return data 
else: 
retum blacktole (big- little) 


print (blacktole (126) ) 


fi 3-36 24 点 游戏 是 指 随机 选取 4 张 扑 克 牌 (不 包括 大 小 王 ), 然 后 通过 四 则 运算 来 
构造 表达 式 ,如 果 表 达 式 的 值 恰好 等 于 24 就 赢 一 次 。 下 面 的 代码 定义 了 一 个 函数 用 来 测 
试 随机 给 定 的 4 个 数 是 否 符合 24 点 游戏 规则 ,如 果 符 合 就 输出 所 有 可 能 的 表达 式 。 


fram randcm import randint 
fram itertools import permutations 


#4 个 数字 和 2 个 运算 符 可 能 组 成 的 表达 式 形式 
eps = ('(($s $5 $s)$s $s)$s $s', 

' ($3 $s $s)$s($s Ss $3)', 

'($s $s($s $s $3))$s $s', 

'$s $s(($s Ss $s)$s $5)', 

'$s $s($s $s($s Ss $3))") 
gsr- * /' 


def test24 (v) : 
result- [] 
Python 允许 函数 的 嵌 套 定义 
# 这 个 函数 对 字符 串 表 达 式 求 值 并 验证 是 否 等 于 24 
def check(exp) : 
try: 
# 有 可 能 会 出 现 除 0 异常 ,所 以 放 到 异常 处 理 结构 中 
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retum int (eval (exp))== 24 
exoept: 
retum False 
# 全 排列 , 枚 举 4 个 数 的 所 有 可 能 顺序 
for a in permitations (v) : 
# 查 找 4 个 数 的 当前 排列 能 实现 24 的 表达 式 
t= [ep $ (a[0], opl, a[l], op2, a[2], op3, a[3])for opl in ops for ap? in aps for op3 in ops for 
exp in eps if check(exp $ (a[0], opl, a[1], op2, a[2], op3, a[31))] 
ift: 
result.append(t) 
return result 


for i in range (20) : 
print('- '* 20) 
# 生 成 随机 数字 进行 测试 
lst- [randint (1, 14)for j in range(4)] 
r-test?4 (1st) 
ifr: 
print (r) 
else: 
print('No answer for ', lst) 


例 3-37. 双色球 是 一 种 比较 常见 的 彩票 玩法 ,每 一 注 彩票 由 6 个 介 于 1 到 33 之 间 的 


不 重复 数字 和 1 个 介 于 1 到 16 之 间 的 数字 组 成 。 下 面 的 代码 用 来 随机 生成 一 注 双 色 球 
彩票 ,结果 是 完全 随机 的 。 


import randcm 


def doubleColor(): 
red- randam.sample (range (1,34) , 6) 
blue- randan.choice (range (1, 17)) 
return str (red) '- ' str (blue) 


print (doubleColor ()) 


例 3-38 八 皇 后 问题 。 八 皇后 问题 是 高 斯 先生 (就 是 小 时 候 就 把 1 十 2 十 3 十 … 十 100 
转换 成 (1 十 100) X50 的 那个 数学 家 ) 在 60 多 年 以 前 提出 来 的 ,是 一 个 经 典 的 回溯 算法 问 
题 , 其 核心 为 : 在 国际 象棋 棋盘 (8 行 8 列 ) 上 摆 放 8 个 皇后 ,要 求 8 个 皇后 中 任意 两 个 都 
不 能 位 于 同一 行 、 同 一 列 或 同一 斜 线 上 。 

def isValid(s, col): 

""'! 这 个 函数 用 来 检查 最 后 一 个 皇后 的 位 置 是 否 合法 '"' 
# 当 前 皇后 的 行 号 


row-len(s) 


# 检 查 当 前 的 皇后 们 是 否 有 冲突 
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for r, c in enmerate(s) : 
# 如 果 这 一 列 已 有 皇后 ,或 者 某 个 皇后 与 当前 皇后 的 水 平 与 垂直 距离 相等 
# 就 表示 当前 皇后 位 置 不 合法 ,不 允许 放置 
if c ==] or abs (row- x)- — abs (col- c) : 
return False 


retum True 


def queen (n, = 0): 
"这 个 函数 返回 的 结果 是 每 个 皇后 所 在 列 号 '"" 
# 已 是 最 后 一 个 皇后 ,保存 本 次 结果 
if len(s)==n: 
retum [s] 


res- [] 
for col in range(n) : 
if not isValid(s, col): continue 
for r in queen (n, s + (col,)): 
res.append(r) 


return res 


# 形 式 转换 ,最 终结 果 中 包含 每 个 皇后 所 在 的 行 号 和 列 号 
result- [[(r, c)for r, c in enumerate(s)] for s in queen(8)] 
# 输 出 合法 结果 的 数量 
print (len (result)) 
# 输 出 所 有 可 能 的 结果 ,也 就 是 所 有 皇后 的 摆 放 位 置 
# 结 果 中 每 个 皇后 的 位 置 是 一 个 元 组 ,里 面 两 个 数 分 别 是 行 号 和 列 号 
for r in result: 
print (r) 


P d 面向 对 象 程序 设计 
( 


面向 对 象 程序 设计 (Object Oriented Programming,OOP) 的 思想 主要 针对 大 型 软件 
设计 而 提出 ,使 得 软件 设计 更 加 灵活 ,能 够 很 好 地 支持 代码 复 用 和 设计 复 用 ,代码 具有 更 
好 的 可 读 性 和 可 扩展 性 ,大 幅度 降低 了 软件 开发 的 难度 。 面 向 对 象 程序 设计 的 一 个 关键 
性 观念 是 将 数据 以 及 对 数据 的 操作 封装 在 一 起 ,组 成 一 个 相互 依存 不 可 分 割 的 整体 , 即 
对 象 , 不 同 对 象 之 间 通 过 消息 机 制 来 通信 或 者 同步 。 对 于 相同 类 型 的 对 象 (instance) 进 行 
分 类 ,抽象 后 ,得 出 共同 的 特征 而 形成 了 类 (class) ,面向 对 象 程序 设计 的 关键 就 是 如 何 合 
理 地 定义 这 些 类 并 且 合 理 组 织 多 个 类 之 间 的 关系 。 

Python 是 真正 面向 对 象 的 高 级 动态 编程 语言 ,完全 支持 面向 对 象 的 基本 功能 ,如 封 
装 、 继 承 . 多 态 以 及 对 基 类 方法 的 覆盖 或 重 写 。Python 中 对 象 的 概念 很 广泛 ,Python 中 
的 一 切 内 容 都 可 以 称 为 对 象 ,函数 也 是 对 象 。 创 建 类 时 用 变量 形式 表示 对 象 特征 的 成 员 
称 为 数据 成 员 (attribute) ,用 函数 形式 表示 对 象 行为 的 成 员 称 为 成 员 方法 (method) ,数据 
成 员 和 成 员 方 法 统称 为 类 的 成 员 。 


4.1 基础 知识 


411 类 的 定义 与 使 用 


Python 使 用 class 关键 字 来 定义 类 , class 关键 字 之 后 是 一 个 空格 , 接 下 来 是 类 的 名 
字 , 如 果 派 生 自 其 他 基 类 的 话 则 需要 把 所 有 基 类 放 到 一 对 圆 括号 中 并 使 用 逗号 分 隔 , 然 后 
是 一 个 冒号 ,最 后 换行 并 定义 类 的 内 部 实现 。 类 名 的 首 字母 一 般 要 大 写 ,当然 也 可 以 按照 
自己 的 习惯 定义 类 名 ,但 是 一 般 推荐 参考 惯例 来 命名 ,并 在 整个 系统 的 设计 和 实现 中 保持 
风格 一 致 ,这 一 点 对 于 团队 合作 非常 重要 。 例 如 : 

class Car (doject) : # 定 义 一 个 类 ,派生 自 coject 类 

def infor (self): # 定 义 成 员 方法 
print(" This is a car ") 

定义 了 类 之 后 ,就 可 以 用 来 实例 化 对 象 ,并 通过 “对 象 名 . 成 员 ” 的 方式 来 访问 其 中 的 

数据 成 员 或 成 员 方 法 ,例如 : 


»»»car-Car() # 实 例 化 对 象 


第 4 章 面向 对 象 程序 设计 à 123 
e 


»»»car.infor() # 调 用 对 象 的 方法 

This is a car 

在 Python 中 ,可 以 使 用 内 置 方法 isinstance() 来 测试 一 个 对 象 是 否 为 某 个 类 的 实例 ， 
例如 : 

»»»isinstance(car, Car) 

True 

»»»isinstance(car, str) 

False 


最 后 ,Python 提供 了 一 个 关键 字 pass DUET IW IS fie (F4 t. A: A AE 0 AMH TEX A ER 
数 的 定义 中 或 者 选择 结构 中 ,表示 空 语句 。 如 果 暂 时 没有 确定 如 何 实现 某 个 功能 ,或 者 为 
以 后 的 软件 升级 预 留 空间 ,可 以 使 用 关键 字 pass 来 “ 占 位 ”。 例 如 ,下 面 的 代码 都 是 合 
法 的 ， 


>>>class A: 
>>> def dem(): 


>>>if 53: 
Pass 


SANER: 可 以 使 用 三 引号 为 类 进行 必要 的 注释 ,例如 : 


>>> class Test: 
'''This is only a test.''" 
pass 

>>>Test. doc — 

"This is only a test." 


412 私有 成 员 与 公有 成 员 


从 形式 上 看 ,在 定义 类 的 成 员 时 ,如 果 成 员 名 以 两 个 下 划 线 (__) 开 头 则 表示 是 私有 成 
员 , 但 是 Python 并 没有 对 私有 成 员 提供 严格 的 访问 保护 机 制 。 私 有 成 员 在 类 的 外 部 不 能 
直接 访问 ,一 般 是 在 类 的 内 部 进行 访问 和 操作 ,或 者 在 类 外 部 通过 调用 对 象 的 公有 成 员 方 
法 来 访问 。 另 外 ,Python 提供 了 一 种 特殊 方式 “对 象 名 ._ 类 名 _xxx? 可 以 访问 私有 成 员 ， 
但 这 会 破坏 类 的 封装 性 ,不 推荐 这 样 做 (不 过 真 的 很 难 阻止 别人 这 么 做 ) 。 公 有 属性 是 可 


以 公开 使 用 的 , 既 可 以 在 类 的 内 部 进行 访问 ,也 可 以 在 外 部 程序 中 使 用 。 


>>>class A: 
def init (self, valuel- 0, value2-0): # 构 造 函 数 
self. valuel- valuel 
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self.  value2- value? # 私 有 成 员 
def setValue(self, valuel, value2): # 成 员 方法 
self. valuel-valuel 
self. value2-value2 # 在 类 内 部 可 以 直接 访问 私有 成 员 
def show (self): # 成 员 方法 


print(self. valuel) 
print(self. — value2) 


»»»a-AQ 

»»»a. valuel # 在 类 外 部 可 以 直接 访问 非 私 有 成 员 
0 

>>>a. A value # 在 外 部 访问 对 象 的 私有 数据 成 员 

0 


在 IDLE 环境 中 ,在 对 象 或 类 名 后 面 加 上 一 个 圆 点 “.”, 稍 等 一 秒 钟 则 会 自动 列 出 其 
所 有 公开 成 员 , 如 图 4-1 所 示 ,模块 也 具有 同样 的 特点 。 

而 如 果 在 圆 点 *. "后面 再 加 一 个 下 画 线 , 则 会 列 出 该 对 象 或 类 的 所 有 成 员 , 包 括 私有 
成 员 , 如 图 4-2 所 示 。 


>>> 


>>> 国 >>> 
35» how >>> 
>>> >>> 


>>> >>> 
>>> >>> 


x . z E 
»» a.l z >>> a.] 
图 4-1 列 出 对 象 公开 成 员 图 4-2 列 出 对 象 所 有 成 员 


在 Python 中 ,以 下 夯 线 开头 和 结束 的 成 员 名 有 特殊 的 含义 ,类 定义 中 用 下 面 线 作为 
变量 名 和 方法 名 前 维和 后 织 来 表示 类 的 特殊 成 员 。 

A) xxx: 保护 成 员 ,不 能 用 from module import * 导入 ,只 有 类 对 象 和 子 类 对 象 可 
以 访问 这 些 成 员 。 

(2) xxx: 系统 定义 的 特殊 成 员 , 详 见 4.1.7 节 。 

(3) xxxi: 类 中 的 私有 成 员 , 一 般 只 有 类 对 象 自己 能 访问 , 子 类 对 象 也 不 能 访问 到 
这 个 成 员 , 但 在 对 象 外 部 可 以 通过 “对 象 名 ._ 类 名 __xxx” 这 样 的 特殊 方式 来 访问 。 

EEE: Python 中 不 存在 严格 意义 上 的 私有 成 员 。 

LAMER: 在 IDLE 交互 模式 下 ,下 画 线 (_) 表 示 解 释 器 中 最 后 一 次 语句 正确 执行 
的 输出 结果 。 例 如 

2»5»3*5 

8 


»»» 2 
10 
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»»» * 3 

30 

»»» /5 

6.0 

>>>3 

3 

>>>1/0 

Traceback (most. recent call last): 

File "< pyshell£2» ", line 1, in «module» 

1/0 

ZeroDivisionError: integer division or modulo by zero 

>>>_ 

3 


413 数据 成 员 


数据 成 员 用 来 说 明 对 象 特有 的 一 些 属性 ,如 人 的 身份 证 号 、 姓 名、 年 龄 .性别 、 身 高 ,学 
历 ,汽车 的 品牌 .颜色 .最 高 时 速 ,蛋糕 的 名 称 `, 尺寸. 配料 , 书 的 名 字 、 作 者 、ISBN 出 版 社 、 
出 版 日 期 ,等 等 。 

数据 成 员 可 以 大 致 分 为 两 类 : 属于 对 象 的 数据 成 员 和 属于 类 的 数据 成 员 。 属 于 对 象 


象 ,在 定义 类 时 这 类 数据 成 员 不 在 任何 一 个 成 员 方法 的 定义 中 。 在 主 程序 中 或 类 的 外 部 ， 
对 象 数据 成 员 属于 实例 (对 象 ), 只 能 通过 对 象 名 访问 ,而 类 数据 成 员 属于 类 ,可 以 通过 类 
名 或 对 象 名 访问 。 另 外 ,在 Python 中 可 以 动态 地 为 类 和 对 象 增加 成 员 , 这 也 是 Python 


动态 类 型 的 一 种 重要 体现 。 


class Car (cbject) : 


prioe- 100000 # 属 于 类 的 数据 成 员 
def _ init (self, c): 
self.color-c # 属 于 对 象 的 数据 成 员 

carl= Car ("Red") # 实 例 化 对 象 
car2- Car ("Blue") 
print (carl.color, Car.prios) # 访 问 对 象 和 类 的 数据 成 员 
Car.pricer= 110000 # 修 改 类 的 属性 
Car.name- 'Qo' # 动 态 增加 类 的 属性 
carl.color- "Yellow" # 修 改 实例 的 属性 


print(car2.color, Car.price, Car.name) 
print(carl.color, Car.price, Car.name) 
def setSpeed(self, s): 

self.speed- s 
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inport types 
cari. setSpeed- types MethodIype (setSpeed, cari) HSAH RHMAN 
carl.setSpeed (50) # 调 用 对 象 的 成 员 方 法 


print (carl.speed) 
(以 拓展 知识 : 利用 类 数据 成 员 的 共享 性 ,可 以 实时 获得 该 类 的 对 象 数 量 , 并 且 可 以 
控制 该 类 可 以 创建 的 对 象 最 大 数量 。 例 如 : 


>>> class Demo (dbject) : 


total-0 
def new  (cls, * args, **kwargs) : # 该 方法 在 __ init _() 之 前 被 调用 
if cls.total >=3: # 最 多 允许 创建 3 个 对 象 
raise Excsption(' 最 多 只 能 创建 3 个 对 象 ) 
else: 


retum cbject. new  (cls) 
def init (self): 
Demo.total- Demp.total+ 1 
»»»tl-Dem() 
>>>tl 
« main  .Demo dbject at 0x00000000034A0278> 
»»»t2-Demo() 
»»»t3-Dem() 
>>> t4 Dem() 
Traceback (most recent call last): 
File "< pyshell#8>", line 1, in «module» 
t4- Demo () 
File "<pyshell#3>", line 5, in mew _ 
raise Excspticn(' 最 多 只 能 创建 3 个 对 象 ') 
Exception: 最 多 只 能 创建 3 个 对 象 
>>>t4 
Traoeback (most recent call last): 
File "«pyshell£9»", line 1, in «module» 
t4 
NemeError: name 't4' is not defined 


444 Jj 


方法 用 来 描述 对 象 所 具有 的 行为 ,例如 ,列表 对 象 的 追加 元 素 、 插 和 元素、 删除 元 素 、 
排序 ,字符 串 对 象 的 分 隔 、 连 接 、 排 版 蔡 换 , 烤 箱 的 温度 设置 . 烘 烙 , 等 等 。 

在 类 中 定义 的 方法 可 以 粗略 分 为 四 大 类 : 公有 方法 、 私 有 方法 .静态 方法 和 类 方法 。 
公有 方法 .私有 方法 一 般 是 指 属于 对 象 的 实例 方法 ,其 中 私有 方法 的 名 字 以 两 个 下 面 线 
C_) 开 始 。 每 个 对 象 都 有 自己 的 公有 方法 和 私有 方法 ,在 这 两 类 方法 中 都 可 以 访问 属于 
类 和 对 象 的 成 员 ; 公 有 方法 通过 对 象 名 直接 调用 ,私有 方法 不 能 通过 对 象 名 直接 调用 ,只 
能 在 实例 方法 中 通过 sel 调用 或 在 外 部 通过 Python 支持 的 特殊 方式 来 调用 。 
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类 的 所 有 实例 方法 都 必须 至 少 有 一 个 名 为 self 的 参数 ,并 且 必 须 是 方法 的 第 一 个 形 


参 (如 果 有 多 个 形 参 的 话 ) ,self 参数 代表 对 象 自 身 。 在 类 的 实例 方法 中 访问 实例 属性 时 
需要 以 self 为 前 绥 , 但 在 外 部 通过 对 象 名 调用 对 象 方法 时 并 不 需要 传递 这 个 参数 ,如 果 在 
外 部 通过 类 名 调用 属于 对 象 的 公有 方法 ,需要 显 式 为 该 方法 的 self 参数 传递 一 个 对 象 名 ， 
用 来 明确 指定 访问 哪个 对 象 的 数据 成 员 。 


静态 方法 和 类 方法 都 可 以 通过 类 名 和 对 象 名 调用 ,但 不 能 直接 访问 属于 对 象 的 成 员 ， 


def show(self): 


print('self.  value:', self. value) 
print('Root.  total:', Root. — total) 


@ classmethod 
def classShowTotal (cls) : 
print(cls. total) 


@ statiamethod 
def staticShowTotal () : 
print(Root. total) 
>>> r=Root (3) 
>>> r.classShowTotal () 
1 
>>> r.staticShowTotal () 
1 
»»»r.show() 
self. value: 3 
Root. total:l 
»»»rr-Foot(5) 
>>> Foot.classshowIotal () 


2 


>> > Root.staticShowTotal () 
2 
>>>Root.show() 
Traceback (most recent call last): 
File "« pyshell$9» ", line 1, in «module» 
Foot.show () 


只 能 访问 属于 类 的 成 员 。 一 般 将 cls 作为 类 方法 的 第 一 个 参数 ,表示 该 类 自身 ,在 调用 类 
方法 时 不 需要 为 该 参数 传递 值 。 例 如 下 面 的 代码 所 演示 : 


# 构 造 函 数 


# 普 通 实例 方法 


# 修 饰 器 ,声明 类 方法 
# 类 方法 


# 修 饰 器 ,声明 静态 方法 


# 静 态 方法 


# 通 过 对 象 来 调用 类 方法 


# 通 过 对 象 来 调用 静态 方法 


# 通 过 类 名 调用 类 方法 


# 通 过 类 名 调用 静态 方法 


# 试 图 通过 类 名 直接 调用 实例 方法 ,失败 
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TypeError: unbound method show ()must be called with Root instance as first argument (got nothing instead) 
»»» Foot.show(r) # 可 以 通过 这 种 方法 来 调用 方法 并 访问 实例 成 员 

self. value: 3 

Root. total:2 

»»»r.show() 

self. value: 3 

Root. total:2 

>>> Eoot.show (rr) # 通 过 类 名 调用 实例 方法 时 为 self 参 数 显 式 传递 对 象 名 
self. value: 5 

Root. total: 2 

»»»rr.show() 

self. value: 5 

Root. total: 2 


SAMER: 在 Python 中 ,在 类 中 定义 实例 方法 时 将 第 一 个 参数 定义 为 self 只 是 一 
个 习惯 ,并 不 必须 使 用 self 这 个 名 字 , 但 是 一 般 也 不 建议 使 用 别 的 名 字 。 同 样 ,属于 类 的 
方法 中 使 用 cls 作为 第 一 个 参数 也 是 一 种 习惯 ,也 可 以 使 用 其 他 的 名 字 作 为 第 一 个 参数 ， 
虽然 不 建议 这 样 做 。 

您 注意 : 不 同 对 象 实例 的 数据 成 员 之 间 互 不 影响 ,是 不 共享 的 。 但 同一 个 类 的 所 有 
实例 方法 是 在 不 同 对 象 之 间 共 享 的 ,所 有 对 象 都 执行 相同 的 代码 ,通过 self 参数 来 判断 要 
处 理 哪个 对 象 的 数据 。 


的 函数 ,通过 对 象 调用 方法 时 ,对 象 本 身 将 被 作为 第 一 个 参数 传递 过 去 ,普通 函数 并 不 具 
备 这 个 特点 。 


>>> class Dem: 
pass 
>>> t=Dm() 
>>> def test (self, v): 
self.valu=v 
>>>t.test= test # 动 态 增 加 普通 函数 
»»»t.test 
< function test at 0x00000000034B7EA0»- 
»»»t.test(t, 3) 
»»»print(t.value) 
3 
>>> import types 
>>> t.test= types.MethodType (test, t) # 动 态 增加 绑 定 的 方法 
»»»t.test 
<bound method test of « — main — .Demo dbject at 0x000000000074F9EB» > 
»»»t.test(5) 
>>>print (t.value) 


第 4 章 面向 对 象 程序 设计 à 129 
e 


5 


415 属性 


公开 的 数据 成 员 可 以 在 外 部 随意 访问 和 修改 ,很 难 控制 用 户 修改 时 新 数据 的 合法 性 。 
解决 这 一 问题 的 常用 方法 是 定义 私有 数据 成 员 , 然 后 设计 公开 的 成 员 方法 来 提供 对 私有 
数据 成 员 的 读 取 和 修改 操作 ,修改 私有 数据 成 员 时 可 以 对 值 进行 合法 性 检查 ,提高 了 程序 
的 健壮 性 ,保证 了 数据 的 完整 性 。 属 性 结合 了 公开 数据 成 员 和 成 员 方法 的 优点 , 既 可 以 像 
成 员 方法 那样 对 值 进行 必要 的 检查 ,又 可 以 像 数据 成 员 一 样 灵活 地 访问 。 

Python 2. x 中 属性 的 实现 有 很 多 不 如 入 意 的 地 方 。 在 Python 3. x 中 ,属性 得 到 了 较 
为 完整 的 实现 ,支持 更 加 全 面 的 保护 机 制 。 如 果 设 置 属性 为 只 读 , 则 无 法 修改 其 值 ,也 无 
法 为 对 象 增加 与 属性 同名 的 新 成 员 , 同 时 ,也 无 法 删除 对 象 属性 。 例 如 ， 


>>> class Test: 
def init — (self, value): 


self. value- value # 私 有 数据 成 员 
6 property # 修 饰 器 ,定义 属性 ,提供 对 私有 数据 成 员 的 访问 
def value (self) : # 只 读 属性 ,无 法 修改 和 删除 
retum self. value 
»»»t-Test(3) 
»»»t.value 
3 
»»»t.value- 5 # 只 读 属 性 不 允许 修改 值 


Traceback (most recent call last): 
File "«pyshell£15l» ", line 1, in «module» 


t.value- 5 
AttributeError: can't set attribute 
»»»t.-5 # 动 态 增加 新 成 员 
>>>t.v 
5 
»»»delt.v # 动 态 删除 成 员 
>> > del t.value # 试 图 删除 对 象 属性 ,失败 


Traceback (most recent call last): 
File "«pyshellf152» ", line 1, in «module» 
del t.value 
AttributeError: can't delete attribute 
»»»t.value 
3 


下 面 的 代码 则 把 属性 设置 为 可 读 、 可 修改 ,而 不 允许 删除 。 


>>> class Test: 
def init (self, value): 
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self. value-value 


def  get(self): # 读 取 私有 数据 成 员 的 值 


returnself. value 


def | set (self v): # 修 改 私有 数据 成 员 的 值 
self. value-v 


value-property( get, — set) # 可 读 可 写 属 性 ,指定 相应 的 读 写 方法 
def show(self): 
print(self. value) 
»»»t-Test(3) 
»»»t.value # 人 允许 读 取 属 性 值 
3 
»»»t.value-5 # 人 允许 修改 属性 值 
>>>t.value 
5 
>>>t.show() # 属 性 对 应 的 私有 变量 也 得 到 了 相应 的 修改 
5 
»»»delt.value # 试 图 删除 属性 ,失败 


Traceback (most. recent call last): 
File "«pyshellf152» ", line 1, in «module» 
del t.value 
AttributeError: can't delete attribute 


当然 ,也 可 以 将 属性 设置 为 可 读 、 可 修改 .可 删除 。 


>>> class Test: 
def | init (self, value): 
self.  value- value 


def — get(self): 
retum self. value 


def — set(self, v): 
self. value-v 


def  del(self): # 删 除 对 象 的 私有 数据 成 员 
delself. value 


value-property( get, set, del) # 可 读 、 可 写 、 可 删除 的 属性 
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>>>t=Test(3) 
>>> t.shw() 
3 
>>>t.value 
3 
»»»t.value-5 
»»»t.show() 
5 
»»»t.value 
5 
»»»delt.value 
»»»t.value # 相 应 的 私有 数据 成 员 已 删除 ,访问 失败 
Traceback (most recent call last): 
File "<pyshell#165>", line 1, in «module» 
t.value 
File "<pyshell#157>", line 6, in — get 
retum self. value 
AttributeError: "Test' dbject has no attribute ' Test — value" 
>>> t.show() 
Traceback (most recent call last): 
File "< pyshell#166>", line 1, in «module» 
t.show() 
File "< pyshell#157> ", line 17, in show 
print(self. value) 
AttributeError: "Test' object has no attribute ' Test — value" 
»»»t.value -1 # 为 对 象 动态 增加 属性 和 对 应 的 私有 数据 成 员 
»»»t.show() 
1 
>>> t.value 
1 


416 继承 


俗话 说 得 好 ,“ 虎 父 无 厂子 ”“ 龙 生 龙 , 凤 生 凤 , 老 鼠 的 儿子 会 打 洞 ”, 这 在 一 定 程度 上 
说 明了 继承 的 重要 性 。 在 面向 对 象 编程 中 ,继承 是 代码 复 用 和 设计 复 用 的 重要 途径 ,是 面 


设计 一 个 新 类 时 ,如 果 可 以 继承 一 个 已 有 的 设计 良好 的 类 然后 进行 二 次 开发 ,无 疑 会 
大 幅度 减少 开发 工作 量 , 并 且 可 以 很 大 程度 地 保证 质量 。 在 继承 关系 中 ,已 有 的 、 设 计 好 
的 类 称 为 父 类 或 基 类 ,新 设计 的 类 称 为 子 类 或 派生 类 。 派 生 类 可 以 继承 父 类 的 公有 成 员 ， 
但 是 不 能 继承 其 私有 成 员 。 如 果 需 要 在 派生 类 中 调用 基 类 的 方法 ,可 以 使 用 内 置 函 数 
super() 或 者 通过 * 基 类 名 .方法 名 ()? 的 方式 来 实现 这 一 目的 。 

f| 4-1. 设计 Person 类 ,并 根据 Person 派生 Teacher 类 ,分 别 创建 Person 类 与 
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Teacher 类 的 对 象 。 


# 基 类 必须 继承 于 cpject, 否 则 在 派生 类 中 将 无 法 使 用 super) ER PC 
class Person (doject) : 
def init — (self, name '', age- 20, sex- 'man'): 
self.setName (nare) # 通 过 调用 方法 进行 初始 化 
self.sethge (age) # 这 样 可 以 对 参数 进行 更 好 地 控制 
self.setSex (sex) 


def setName (self, name) : 
if not isinstance (name, str): 
print ('name mist be string.') 
# 如 果 数 据 不 合法 ,就 使 用 默认 值 
self. name-'" 
retum 


self.  name- name 


def setAge (self, age) : 
if type (age) = int: 
print ('age must be integer. ") 
self.  age-20 
return 


self. age-age 


def setSex(self, sex): 
if sex not in('men', 'wmen'): 
print ('sex must be "man" or "waman"') 
self.  sex- ‘man’ 
retum 


Self.  sex-sex 


def show(self): 
print(self. name, self. age, self. sex, sep- "An') 


# 派 生 类 
class Teacher (Person) : 
def | init (self, name- '', age- 30, sex- 'man', department- 'Camputer'): 

# 调 用 基 类 构造 方法 初始 化 基 类 的 私有 数据 成 员 
super (Teacher, self). init — (name, age, sex) 
# 也 可 以 这 样 初始 化 基 类 的 私有 数据 成 员 
#Person. init _ (self, name, age, sex) 
# 初 始 化 派生 类 的 数据 成 员 
self.setDepartment (department) 
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df setDepartment (self, department) : 
if type (department) != str: 
print ('department must be a string. ') 
self.  department- 'Camuter' 
retum 
self.  department- department 


def show(self): 
super (Teacher, self).show() 
print(self. department) 


if nae  --' main ` 
# 创 建 基 类 对 象 
zhangsan- Ferson ('Zhang San', 19, 'man') 
zhangsan. show () 
print('- '* 30) 


4 创建 派生 类 对 象 
lisi- Teacher('Li si', 32, 'man', 'Math') 
lisi.show() 
# 调 用 继承 的 方法 修改 年 龄 
lisi.setAge (40) 
lisi.show() 
的 小 提示 : Python 支持 多 继承 ,如 果 父 类 中 有 相同 的 方法 名 ,而 在 子 类 中 使 用 时 
没有 指定 父 类 名 , 则 Python 解释 器 将 从 左 向 右 按 顺 序 进行 搜索 。 
下 面 的 代码 完整 地 描述 了 类 的 继承 机 制 , 请 认真 体会 构造 函数 .私有 方法 以 及 普通 公 
开 方法 的 继承 原理 。 


>>>class AQ: 
def init (self): 
self. private() 
self.püblic() 


def  private(self): 
print(' private ()method of A') 


def public(self): 
print ("public ()method of A') 


def  test(self): 
print(* test()method of A') 
>>>class BA): # 注 意 ,B 类 没有 构造 函数 
def — private(self): 
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print(' private ()method of B') 


def piblic(self): 
print (public ()method of B') 
»»»b-B( # 创 建 派 生 类 对 象 
.. private (method of A 
public ()method of B. 
»»»b. test() # 派 生 类 没有 继承 基 类 中 的 私有 成 员 方法 
Traceback (most. recent. call last): 
File "«pyshell£215» ", line 1, in «module» 
b. test 
AttributeError: 'B' cbject has no attribute ' — test' 
»»»class CA): # 注 意 ,C 类 有 构造 函数 
def init (self): 
self. private() 
Self.public() 


def  private(self): 
print(' private()method of C') 


def public (self): 
print ('public ()method of C') 
»»»cC( 
... private () method of C 
public ()method of C 


(QARAR: 所 谓 多 态 , 是 指 基 类 的 同一 个 方法 在 不 同 派生 类 对 象 中 具有 不 同 的 表 
现 和 行为 。 龙 生 九 子 , 子 子 臂 不同。 禅宗 说 “一 花 开 五 叶 ”, 也 是 这 个 道理 。 派 生 类 继承 了 
基 类 的 行为 和 属性 之 后 ,还 会 增加 某 些 特定 的 行为 和 属性 ,同时 还 可 能 会 对 继承 来 的 菜 些 
行为 进行 一 定 的 改变 ,这 恰恰 是 多 态 的 表现 形式 。 在 Python 中 主要 通过 重 写 基 类 的 方 
法 来 实现 多 态 。 


4; 特殊 方法 与 运算 符 重 载 


Python 类 有 大 量 的 特殊 方法 ,其 中 比较 常见 的 是 构造 函数 和 析 构 函数 。Python 中 
类 的 构造 函数 是 _init__O 〇 ,一 般 用 来 为 数据 成 员 设置 初始 值 或 进行 其 他 必要 的 初始 化 工 
作 ,在 创建 对 象 时 被 自动 调用 和 执行 。 如 果 用 户 没有 设计 构造 函数 ,Python 将 提供 一 个 
默认 的 构造 函数 用 来 进行 必要 的 初始 化 工作 。Python 中 类 的 析 构 函数 是 __del__0 〇 ,一 
般 用 来 释放 对 象 占用 的 资源 ,在 Python 删除 对 象 和 收回 对 象 空间 时 被 自动 调用 和 执行 。 
如 果 用 户 没有 编写 析 构 函数 ,Python 将 提供 一 个 默认 的 析 构 函数 进行 必要 的 清理 工作 。 

在 Python 中 ,除了 构造 函数 和 析 构 函数 之 外 ,还 有 大 量 的 特殊 方法 支持 更 多 的 功 
能 ,例如 ,运算 符 重 载 就 是 通过 在 类 中 重 写 特殊 函数 来 实现 的 。 在 自 定义 类 时 如 果 重 写 了 
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某 个 特殊 方法 即 可 支持 对 应 的 运算 符 , 具 体 实现 什么 工作 则 完全 可 以 根据 需要 来 定义 (有 
读者 说 ,好 像 有 点 多 态 的 意思 ) 。 表 4-1 列 出 了 其 中 一 部 分 特殊 方法 ,完整 列表 请 参考 网 
址 https://docs. python. org/3/reference/datamodel. html # special-method-names, 


3 4-1 Python 类 特殊 方法 


5 法 功能 说 明 

. new O 类 的 静态 方法 ,用 于 确定 是 否 要 创建 对 象 
init. OO 构造 函数 ,生成 对 象 时 调用 
. del O 析 构 函数 ,释放 对 象 时 调用 
. add O + 
sub O = 
. mul O * 
. truediv |. / 
. Íloordiv .O // 
..mod O % 
— pow .O x 
__repr_() 打印 ,转换 
__setitem__() 按照 索引 赋值 
_getitem__() 按照 索引 获取 值 
den, O 计算 长 度 
__call O 函数 调用 
__contains_() in 
aO ne O. se Os gt Ou | "m 
—ge O 
st O 转化 为 字符 串 
__lshift O, rshift _O x» 

and O, or O, invert O., xor O & l1. 
. .iadd (O,. isub O tage 

4.2 案例 精 选 

421 自 定义 数组 


例 4-2 自 定义 一 个 数组 类 ,支持 数组 与 数字 之 间 的 四 则 运算 ,数组 之 间 的 加 法 运 
算 、 内 积 运 算 和 大 小 比较 ,数组 元 素 访问 和 修改 ,以 及 成 员 测试 等 功能 。 
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class MyArray: 
"ll the elements in this array mst be numbers! '" 
def  IsNmber(self, n): 
if not isinstance(n, (int, float, oamplex)): 
retum False 
return True 


# 构 造 函 数 ,进行 必要 的 初始 化 
def init (self, * args): 
if not args: 
self. value- [] 
else: 
for arg in args: 
ifnotself.  IsNumber (arg): 
print('All elements must be nunbers!) 
retum 
self.  value- list (args) 


# 析 构 函数 ,释放 内 部 封装 的 列表 
def del (self): 
delself. value 


# 重 载运 算 符 + 
# 数 组 中 每 个 元 素 都 与 数字 n 相 加 ,或 两 个 数组 相 加 ,返回 新 数组 
def adi (self, n): 
ifself. IsNmber(n): 
# 数 组 中 所 有 元 素 都 与 数字 n 相 加 
b=MyArray () 
b.  value- [itemt n for item in self.__value] 
retum b 
elif isinstance(n, MyArray) : 
# 两 个 等 长 的 数组 对 应 元 素 相 加 
if lanm._value)==]len(self._value) : 
c- Myarray () 
c. value-[i*j fori, jinzip(self. value, n. value)] 
#for i, jinzip(self. value, n. value): 
* c. value.append(i* j) 
retum c 
else: 
print ('Lenght. not equal) 
else: 
print ('Not. supported") 


# 重 载运 算 符 - 
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## 数 组 中 每 个 元 素 都 与 数字 n 相 减 ,返回 新 数组 
def sib (self, n): 
ifnotself. IsNaber(n): 
print ('- operating with ', tyce(n), ' and number type is not. sported. ') 
retum 
b= MyArray () 
b. value- [item-n for item in self. value] 
retum b 


# 重 载运 算 符 * 
# 数 组 中 每 个 元 素 都 与 数字 n 相 乘 ,返回 新 数组 
def ml (self, n): 
ifnotself. IsNuber(n): 
print('* cperating with ', tyce(n), ' ard nmber type is not sugported.') 
retum 
b- MyArray () 
b.  value- [item* n for item in self. value] 
retum b 


# 重 载运 算 符 / 
# 数 组 中 每 个 元 素 都 与 数字 n 相 除 ,返回 新 数组 
def  truediv — (self, n): 
ifnotself.  IsNmber(n): 
print (r'/ cperating with ', type(r), ' and iiber type is not supported.) 
retum 
b= MyArray() 
b.  value- [item/n for item inself. value] 
retum b 


# 重 载运 算 符 // 
# 数 组 中 每 个 元 素 都 与 数字 n 整 除 , 返 回 新 数组 
def __floordiv (self, n): 
if not isinstance(n, int): 
print(n, ' is not an integer!) 
retum 
b=MyArray () 
b.  value- [item//n for item in self. value] 
retum b 


# 重 载运 算 符 s 
# 数 组 中 每 个 元 素 都 与 数字 n 求 余数 ,返回 新 数组 
def mod (self, n): 
ifnotself. IsNuber(n): 
print (r'&cperating with ', type(n), ' and number type is not sported. ') 
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retum 
b=MyArray() 
b. _value= [item&n for item in self. value] 
retum b 


# 重 载运 算 符 ** 
# 数 组 中 每 个 元 素 都 与 数字 n 进 行 舌 计 算 , 返 回 新 数组 
def pow (self, n): 
ifnotself. IsNmber(n): 
print(*** cperating with ', tyce(n), ' and nmber type is not sported.. ') 
retum 
b=MyArray () 
b.__value= [item**n for item in self.__value] 
retum b 


def len (self): 
return len(self. value) 


# 直 接 使 用 该 类 对 象 作为 表达 式 来 查看 对 象 的 值 
def repr (self): 
fequivalent to return 'self. value' 

return repr(self. — value) 


# 支 持 使 用 print () 函 数 查 看 对 象 的 值 
def str (self): 
retum str(self. — value) 


# 追 加 元 素 
def append (self, v): 
ifnotself.  IsNumber(v): 
print ('Only mmber can be appended. ') 
retum 
self.__value.append (v) 


# 获 取 指定 下 标的 元 素 值 ,支持 使 用 列表 或 元 组 指定 多 个 下 标 
def getitem — (self, index): 
length-len(self. value) 
# 如 果 指 定单 个 整数 作为 下 标 , 则 直接 返回 元 素 值 
if isinstance (index, int)and K = index« length: 
return self.  value[index] 
# 使 用 列表 或 元 组 指定 多 个 整数 下 标 
elif isinstance (index, (list, tuple)) : 
for i in index: 
if not (isinstance (i, int)and (« — i< length) : 
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result- [] 
for item in index: 
result.append(self. ^ value[item]) 
return result 
else: 
return 'index error' 


# 修 改元 素 值 ,支持 使 用 列表 或 元 组 指定 多 个 下 标 ,同时 修改 多 个 元 素 值 
def 。 setitem _ (self, index, value): 
length-len(self. value) 
# 如 果 下 标 合法 , 则 直接 修改 元 素 值 
if isinstance (index, int)and K = index< length: 
self.  value[index]- value 
# 支 持 使 用 列表 或 元 组 指定 多 个 下 标 
elif isinstance (index, (list,tuple)): 
for i in index: 
if not (isinstance (i,int)and K = i< length) : 
raise Exception ('index error') 
# 如 果 下 标 和 给 的 值 都 是 列表 或 元 组 ,并且 个 数 一 样 
# 则 分 别 为 多 个 下 标的 元 素 修改 值 
if isinstance(value, (list,tuple)): 
if len (index)== len (value) : 
for i, v in enmerate (index) : 
self. value[v]- value[i] 
else: 
raise Exception ('values and index must be of the same length') 
# 如 果 指 定 多 个 下 标 和 一 个 普通 值 , 则 把 多 个 元 素 修改 为 相同 的 值 
elif isinstance (value, (int, float, complex) ) : 
for i in index: 
self. value[i]- value 
else: 
raise Exception('value error!) 
else: 
raise Exoeption('index error') 


# 支 持 成 员 测试 运算 符 in, 测 试 数组 中 是 否 包含 某 个 元 素 
def contains (self, v): 
ifvinself. value: 
return True 
return False 


# 模 拟 向 量 内 积 
def dot (self, v): 
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if not isinstance (v, MyArray): 
print(v, ' must be an instance of MyArray.') 
retum 
iflen(y!-len(self. value): 
print ("The size mst be equal. ") 
retum 


retum sum([i* j for i,j inzip(self. value, v.__valu)]) 


#b=MyArray () 

#for m, n in zip{v.__valu, self. value): 
+ b.__value.append(m * n) 

fretum sum(b. value) 


# 重 载运 算 符 == ,测试 两 个 数组 是 否 相等 
def eq (self, v): 


if not isinstance (v, MyArray): 
print(v, ' must be an instance of MyArray.') 
return False 

ifself. value--v. value: 
return True 

return False 


# 重 载运 算 符 < ,比较 两 个 数组 大 小 


def. 


_lt (self, v): 

if not isinstance (v, MyRrray) : 

print(v, ' must be an instance of MyArray.') 
return False 


if nme  --' mein "': 


print('Please use me as a module.) 


将 上 面 的 程序 保存 为 MyArray. py 文件 ,可 以 作为 Python 模块 导入 并 使 用 其 中 的 数 


组 类 。 


>> > fram MyArray import MyArray 
2»»x-Mhrray(l, 2, 3, 4, 5, 6) 
>>>y=MyArray(6, 5, 4, 3, 2, 1) 
>>> len(x) 

6 

»»»xt5 

[6, 7, 8, 9, 10, 11] 

»»»x* 3 


[3, 6, 9, 12, 15, 18] 


# 导 入 模块 中 的 自 定义 类 
# 实 例 化 对 象 


# 返 回 数组 长 度 , 即 数 组 中 的 元 素 个 数 
# 每 个 元 素 加 5 返回 新 数组 


# 每 个 元 素 乘 以 3 返回 新 数组 
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>>>x.dot (y) # 计 算 两 个 数组 (一 维 向 量 ) 的 内 积 
56 

»»»x.append(7) # 在 数组 尾部 追加 新 元 素 
>>>x 

IL, 2, 3, 4, 5, 6 7] 

>>>x.dot (y) 

The size mist be equal. 

»»»x[9-8 # 试 图 修改 元 素 值 

Index type error or out of range 

ss»x*q2 

[0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5] 

>>>x//2 

I0, 1, 1, 2, 2, 3, 3] 

>>>x %3 

[1, 2, 0, 1, 2, 0, 1] 

»»»x[2] # 返 回 指定 位 置 的 元 素 值 

3 

»»»'a'inx # 测 试 数组 中 是 否 包含 某 个 元 素 
False 

»»»3inx 

True 

>>>x<y # 比 较 数 组 大 小 

True 

»»»x-MyArray (1, 2, 3, 4, 5, 6) 

»»»xty # 两 个 数组 中 对 应 元 素 相 加 ,返回 新 数组 
[7, 7, 7,7, 7, 7] 

>>>x[[2,3,4]] # 查 看 多 个 位 置 上 的 元 素 值 
[3, 4, 5] 

>>>x[[2, 3]]= [8, 9] # 同 时 修改 多 个 元 素 的 值 
>>>x 

[1, 2, 8, 9, 5, 6] 

»»»x[[1,3,5]]- 0 # 为 多 个 元 素 赋值 为 相同 的 值 
2»2»X 

[1, 0, 8, 0, 5, 0] 
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例 4-3 模拟 矩阵 运算 ,支持 矩阵 转 置 ,修改 矩阵 大 小 ,矩阵 与 数字 的 加 、 减 \ 乘 运算 ， 
以 及 和 矩阵 与 矩阵 的 加 \ 减 、 乘 运算 。 


class simNumpyArray (cbject) : 
def init (self, p): 
"可 以 接收 列表 、 元 组 ,range 对 象 等 类 型 的 数据 ,并 且 每 个 元 素 都 必须 为 数字 '" 
if type(p)not in(list, tuple, range): 
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print ('data type error') 
retum 
for item in p: 
# 下 面 这 行 用 来 判断 参数 类 型 ,可 以 这 样 写 
#if isinstance (item (int, float, camplex)): 
if type (item) not in(int, float, complex): 
print ('data type error!) 


retum 
self.  data- [list(p)] 
Self. row-1l 


self.  col-len(p) 


# 析 构 函 数 
def del (self): 
delself. data 


# 修 改 大 小 ,首先 检查 给 定 的 大 小 参数 是 否 合适 
def reshape (self, size): 
"参数 必须 为 元 组 或 列表 ,如 (row, co1) s [row,col] 
row 或 col 其 中 一 个 可 以 为 -1, 表 示 自 动 计算 
if not (isinstanoe (size, list)or isinstanoe (size, tuple)): 
print ('size parameter error') 
retum 
if len(size)!-2: 
print ('size parameter error') 
retum 
if (not isinstance (size[0],int))or (not isinstance (size[1],int)): 
print('size parameter error!) 
retum 
if size[0] !=- land size[1] !=- land size[0] * size[1] !=self.__row* self. col: 
print('size parameter error') 
retum 
# 行 数 或 列 数 为 -1 表示 该 值 自动 计算 
if size[0] ==-1: 
ifsize[l]---1lor(self. row* self. col)*size[1] !=0: 
print('size parameter error') 
retum 


if size[1] == 


# 重 新 合并 数据 
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data- [t for i in self. data for t in i] 
# 修 改 大 小 
if size[0] ==- 1: 
self._row= int(self._ rowx self.  col/size[1]) 


self. col=int(self. rowx self.  col/size[0]) 
self.  row-size[0] 
else: 
self.  row-size[0] 
self. col-size[l] 
self. data- [[data[row* self. — colt col] for col in range(self. ^ col)] for row in range 
(self.  row)] 


# 在 交互 模式 直接 使 用 变量 名 作为 表达 式 查看 值 时 调用 该 函数 
def repr (self): 
fretum repr('Wn'.join(map(str, self. — data))) 
foriinself. data: 
print(i) 
retum '"' 


HEH print 0 函数 输出 值 时 调用 该 函数 
def str (self): 
retum "An'.join(mep(str, self.  data)) 


# 属 性 ,矩阵 转 置 
@ property 
def T(self): 
b-simNumpyArray([t for i in self. — data for t in i]) 
b.reshape((self. row, self. —col)) 
b. __datæ list (map (list, zip(* b.  data))) 
b. row,b. ol=b. col,b. row 
retum b 


# 通 用 代码 ,适用 于 矩阵 与 整数 .实数 , 复 数 的 加 、 减 , 乘 、 除 ,整除 . 寡 

def | cperate(self, n, op): 
b-simNumyyArray([t for i in self. data fort in i]) 
b.reshape((self. row, self.  col)) 
b. data- [[eval (str (j)+ opt str (n))for j in item] for item inb. — data] 
retum b 


# 通 用 代码 ,适用 于 和 矩阵 之 间 的 加 \ 减 
def 。 matrixpddsub (self， n, op): 
c= sinamyArray ([1]) 
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C. row-self. row 

c. col-eself. col 

c.  data- [[eval (str (x[i])+ opt str(y[i]))fori in range (len(x))] for x,y inzip(self. data, 
n. data)] 

return c 


# 所 有 元 素 统一 加 一 个 数字 ,或 者 两 个 矩阵 相 加 
def adi (self, n): 
# 人 参数 是 整数 或 实数 , 则 返回 矩阵 
# 其 中 的 每 个 元 素 为 原 矩阵 中 元 素 与 该 整数 或 实数 的 加 法 结果 
if type(n)in(int, float, complex): 
retum self. cperate(n, '*') 
elif isinstance(n, simnNumpyArray): 
# 如 果 参 数 为 同类 型 矩阵 , 且 大 小 一 致 , 则 为 两 个 矩阵 中 对 应 元 素 相 加 
ifn. row--self. rowandn. col==self. col: 
retum self.  matrixAddSub(n, '+ ") 
else: 
print('two matrix must be the same size') 
retum 
else: 
print ('data type error') 
retum 


# 所 有 元 素 统一 减 一 个 数字 ,或 者 两 个 矩阵 相 减 
def sub (self, n): 
# 参 数 是 整数 或 实数 , 则 返回 矩阵 
# 其 中 的 每 个 元 素 为 原 矩阵 中 元 素 与 该 整数 或 实数 的 加 法 结果 
if type(n)in(int, float, complex): 
retum self.  operate(n, '- ') 
elif isinstance(n, simNumpyArray): 
JR S380 FAE HE , HUS — St LUUD PII Pe h Xh 7C CR 
ifn. row-—-self. rowandn.  col--self. col: 
# 先 实例 化 一 个 临时 对 象 , 其 值 临时 为 D] 
retum self.  matrixAdidSub(n, '- ') 
else: 
print ('two matrix must be the same size') 
retum 
else: 
print ('data type error') 
retum 


# 所 有 元 素 统一 乘 一 个 数字 ,或 者 两 个 矩阵 相 乘 
def ml (self, n): 
# 参 数 是 整数 或 实数 , 则 返回 矩阵 
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# 其 中 的 每 个 元 素 为 原 和 矩阵 中 元 素 与 该 整数 或 实数 的 加 法 结果 
if type(n)in(int, float, complex): 
retum self. operate(n, '* ') 
elif isinstance(n, simNumpyArray): 
# 如 果 参 数 为 同类 型 矩阵 , 且 第 一 个 矩阵 的 列 数 等 于 第 二 个 矩阵 的 行 数 
ifn. row--self. col: 
data- [] 
forrowinself. data: 
cu 
foriiinrange(n. col): 
col= [c[ii] for cinn. data] 
tt-sum([i* j for i,j in zip(row,col)]) 
t.append (tt) 
data.append(t) 
c- sinNumpyArray([t for i in data for t in i]) 
c.reshape((self. row, n.  col)) 
retum c 
else: 
print('size error.') 
retum 
else: 
print ('data type error') 
retum 


# 所 有 元 素 统一 除 以 一 个 数字 ,本 程序 使 用 Python 3.5.1 编 写 , 真 除法 
def _ truediv — (self, n): 
if type(n)in(int, float, complex): 
retum self.  cperate(n, '/') 
else: 
print ('data type error!) 
retum 


PEETRIS AFH A GRE 
def — floordiv (self, n): 
if type(n)in(int, float, camplex): 
retum self.  cperate(n, '//") 
else: 
print ('data type error') 
retum 


# 和 矩阵 与 数字 的 寡 运 算 
def pow (self, n): 
if type(n)in(int, float, complex): 
returnself.  cperate(n, **') 
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else: 
print ('data type error') 
retum 


# 测 试 两 个 矩阵 是 否 相等 
def eq (sf, n): 
if isinstance(n, sinNumpyArray): 
ifself. data--n. data: 
retum True 
else: 
return False 
else: 
print ('data type error') 
retum 


# 测 试 矩 阵 自 身 是 否 小 于 另 一 个 矩阵 
def lt (self, n): 
if isinstance(n, sinNumpyArray): 
ifself. datacn. data: 
return True 
else: 
return False 
else: 
print ('data type error') 
retum 


# 成 员 测试 运算 符 
def | contains (self, v): 
ifvinself. data: 
return True 
else: 
return False 


# 支 持 迭 代 
def iter (self): 
return iter(self. data) 


# 通 用 方法 ,计算 三 角 函 数 
def — triangle(self, method) : 
try: 
b-simNumyArray([t for i in self. data fort in i]) 
b.reshape((self. row, self.  col)) 
b. data-[[eval(" import — ('math') ."+ method* " ("+ str (j) * ")") for j in item] for 
iteminb. data] 
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retum b 
except: 
return "method error' 


# 属 性 ,对 所 有 元 素 求 正弦 
@property 
def Sin(self): 

retum self. triangle('sin') 


# 属 性 ,对 所 有 元 素 求 余弦 
@ property 
def Cos (self): 
retum self.  triangle('cos') 


423 自 定义 队列 
队列 是 一 种 特殊 的 线性 表 , 只 允许 在 队列 尾部 进行 元 组 插入 操作 和 在 队列 头 部 进行 


业 管 理 等 方面 具有 重要 的 应 用 。 
Python 列表 对 象 的 append() 方 法 用 于 在 列表 尾部 追加 元 素 ,pop(0) 可 以 删除 并 返 
回 列表 头 部 的 元 素 。 


»»»xll 

»»»x.append(l) # 在 尾部 追加 元 素 ,模拟 和 人 队 操作 
>>>x.append(2) 

>>>x.append(3) 

>>>x 

[ 2, 3] 

»»»3x.pop(0) # 在 头 部 弹出 元 素 ,模拟 出 队 操 作 
Ed 

>>>x 

[2, 3] 

»»»x.pop(0) 


2 


2»»x.pop(0) 


>>>x 


»»»xpop(0) # 空 队列 弹出 头 部 元 素 失败 , 抛 出 异常 
Traceback (most recent call last): 
File "< pyshell#233>", line 1, in «module» 
x-pop (0) 
IndexError: pop fram empty list 
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从 上 面 的 代码 可 以 看 出 ,使 用 Python 列表 直接 模拟 队列 结构 ,无 法 限制 队列 的 大 
小 ,并 且 当 列表 为 空 时 进行 弹出 元 素 的 操作 会 抛 出 异常 。 可 以 对 列表 进行 封装 , 自 定义 队 
列 类 来 避免 这 些 问 题 。 

例 4-4 设计 自 定义 队列 类 ,模拟 入 队 、 出 队 等 基本 操作 。 


class myQueue: 
# 构 造 函 数 ,默认 队列 大 小 为 10 
def init (self, size- 10): 
self. content- [] 
Self. size- size 
self. current- 0 


# 析 构 函 数 
def del (self): 
del self. content 


def setSize(self, size): 
if size< self. current: 
# 如 果 缩 小 队列 ,应 删除 后 面 的 元 素 
for i in range(size, self. current) [::- 1]: 
del self. content[i] 
self. current- size 


Self. size- size 


LASS 
def put (self, v): 
if self. current< self. size: 
self. content.append(v) 
self. current- self. currenttl 
else: 
print ("The queue is full!) 
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print ("The queue is empty’) 


# 把 队列 置 空 

df enpty (self) : 
self. content- [] 
self. current- 0 


print('Please use me as a module.') 


将 上 面 的 代码 保存 为 myQueue. py 文件 ,并 保存 在 当前 文件 夹 .Python 3. 5 安装 文 
件 夹 或 sys. path 列表 指定 的 其 他 文件 夹 中 ,当然 也 可 以 使 用 append() 方 法 把 该 文件 所 在 
文件 夹 添加 到 sys. path 列表 中 。 下 面 的 代码 演示 了 自 定义 队列 类 的 用 法 。 


>>> inport myQueue # 导 入 包含 自 定 义 队列 类 的 模块 
»»»qg-myQueue.myQueue () # 创 建 自 定义 队列 对 象 
»»»q.get() # 获 取 元 素 

The queue is empty 

»»»q.put (5) # 在 队列 尾部 插入 元 素 
»»»q.put(7) 

»»»q.isFull( SELBE 91 3E 8 CL W 
False 

»»»q.put('a') 

>>>q.put (3) 

>>>q.shw() # 查 看 队列 中 的 所 有 元 素 
I5, 7, 'a', 3] 

»»»q.setSize(3) # 修 改 队列 的 大 小 
>>>q.show() 

[5, 7, 'a'] 

»»»q.put(10) 

The queue is full 

»»»q.setSize(5) 

»»»g.put (10) 
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»»»q.show() 
[5, 7, 'a', 10] 


QARA iB; Python 标准 库 queue 提供 了 LILO 队列 类 Queue, LIFO 队列 类 
LifoQueue、 优 先 级 队列 类 PriorityQueue, 标 准 库 collections 提供 了 双 端 队列 。 例 如 : 


>>> fram queue import Queue. #ILID 队 列 

>>> 叶 Queue() # 创 建 队列 对 象 
»»»q.put(0) # 在 队列 尾部 插入 元 素 
>>>q.put(1) 

>>>q.put (2) 

»»» print (q.queue) # 查 看 队列 中 的 所 有 元 素 
deque([0, 1, 2]) 

»»»q.get() # 返 回 并 删除 队列 头 部 元 素 
0 

>>>q.get() 

1 

»»»q.quue 

deque ([2]) 

»»»q.getÜ 

2 

> > > fran queue import LifoQueue #LIFDO 队 列 
»»»q-LifcoQueue () # 创 建 LIFD 队 列 对 象 
>>>q-put() # 在 队列 尾部 插入 元 素 
»»»q.put(2) 

>>>q.put (3) 

»»»q.queue # 查 看 队列 中 的 所 有 元 素 
B, 2, 3] 

»»»q.get( # 返 回 并 删除 队列 尾部 元 素 
3 

»»»q.queue 

[ 2] 

»»»q.get( 

»»»q.queue 

nul 

> > > frm queue import PriorityQueue # 优 先 级 队列 

>>> 中 Priorityoueue() # 创 建 优先 级 队列 对 象 
»»»q.put(3) # 插 入 元 素 

»»»q.put (8) # 插 和 元素 

»»»q.put (100) 


>>> qqueue # 覃 看 优先 级 队列 中 的 所 有 元 素 
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[3, 8, 100] 

>>>q.put (1) # 插 和 元素 ,自动 调整 优先 级 队列 
>>> q.put (2) 

»»»q.queue 

[1, 2, 100, 8, 3] 

»»»q.get( # 返 回 并 删除 优先 级 最 低 的 元 素 
了 

>>>Gq-get() 


2 


>>>q.æt() 
3 
>>>q.get() 
8 
>>>q.gt() 
100 


>>> frm collections import deque # 双 端 队列 
»»»q-dege(['Eric', 'Uchn', 'Smith']) 

>>>q 

deque(['Eric', 'John', 'Smith'] 

»»» q.append ('Tam') # 在 右 侧 插入 新 元 素 
>>>q.appendleft ("Terry") # 在 左 侧 插入 新 元 素 
»»»q 
deque(["Terry', 'Eric', 'Jchn', 'Smith', "Tcm'] 

»»»q.rotate(2) # 循 环 右 移 2 次 
>>>q 
deque (['Smith', "Tom', "Terry', 'Eric', 'John']) 

»»»q.popü # 返 回 并 删除 队列 最 右 端 元 素 
do! 
>>>q 
deque (['Smith', "Tom', "Terry', 'Eric']) 

»»»q.popleft () # 返 回 并 删除 队列 最 左 端 元 素 
"Sith! 


»»»q 
deque (["Tam', "Terry', 'Eric'] 


44 自 定义 栈 
栈 也 是 一 种 运算 受 限 的 线性 表 ,其 特点 在 于 仅 允 许 在 一 端 进行 元 素 的 插入 和 删除 操 


作 , 最 后 人 栈 的 元 素 最 先 出 栈 ,而 最 先入 栈 的 元 素 最 后 出 栈 , 即 * 先 和 后 出 (FILO)” 或 "后 
入 先 出 (LIFO)”。 
使 用 Python 列表 对 象 提供 的 append() .pop() 方 法 也 可 以 模拟 栈 结构 及 其 基本 运 


算 ,但 是 无 法 限制 栈 的 大 小 ,并 且 在 栈 为 空 时 尝试 获取 其 元 素 时 会 引发 异常 ,例如 
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s 


»»»s[ 

»»»s.append(3) # 在 尾部 追加 元 素 ,模拟 入 栈 操 作 
>>> s.append(5) 

>>> s.append(7) 

>>>s 


[3, 5, 7] 
>>>s-pop() # 在 尾部 弹出 元 素 , 模 拟 出 栈 操作 


[3] 
>>>s.pop() 
3 


»»»s.pop() 
Traceback (most. recent call last): 
File "«pyshellf74» ", line 1, in < module» 
5-popÜ 

IndexError: pop fram empty list 

如 同 封装 Python 列表 实现 自 定义 队列 类 一 样 ,也 可 以 对 Python 列表 进行 封装 来 模 
拟 栈 结构 。 

AMER: 使 用 Python 列表 对 象 的 insert(0, x) 和 pop(0) 也 可 以 模拟 栈 的 基本 
操作 ,实现 在 列表 头 部 的 元 素 插 入 和 删除 操作 ,但 这 两 个 方法 会 引发 大 量 的 元 素 移动 操 


作 , 效 率 非 常 低 , 不 建议 使 用 。 
例 4-5 设计 自 定义 栈 类 ,模拟 入 栈 、 出 栈 、 判 断 栈 是 否 为 空 、 是 否 已 满 以 及 改变 栈 大 
小 等 操作 。 
Class Stack: 
def | init (self, size-10): 
self. content- [] # 使 用 列表 存放 栈 的 元 素 
self. size- size # 初 始 栈 大 小 
self. current- 0 # 栈 中 元 素 个 数 初 始 化 为 0 
# 析 构 函 数 


def del (self): 
del self. content 


def empty (sel£) : 
self. content- [] 
self. current- 0 
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def isEmpty (self): 
return not self. content 


def setSize(self, size): 
# 如 果 缩 小 栈 空间 , 则 删除 指定 大 小 之 后 的 已 有 元 素 
if size self. current: 
for i in range (size, self. current) [::- 1]: 
del self. content[i] 
self. current- size 


Self. size- size 


def isFull(self): 
return self. current -— self. size 


def push (self, v): 
if self. current self. size: 
self. content.append(v) 
self. current- self. currentt 1 # 栈 中 元 素 个 数 加 1 
else: 
print ('Stack Full!') 


def pop (self) : 
if self. content: 
self. current- self. current- 1 # 栈 中 元 素 个 数 减 1 
return self. content.popb() 
else: 
print ('Stack is empty! ) 


def show(self): 
print(self. content) 


def showRemainderSpace (self): 
print('Stack can still PUSH ', self. size- self. current, ' elements.') 


if nme  ——' main ': 


print ('Please use me as a module.) 


将 代码 保存 为 Stack. py 文件 ,下 面 的 代码 演示 了 自 定义 栈 结构 的 用 法 。 


>>> inport Stack # 导 入 模块 

>>> s- Stack.Stack() # 实 例 化 对 象 
>>>s.ishpty() # 测 试 栈 是 否 为 空 
True 


>>> sisEull() # 测 试 栈 是 否 已 满 
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False 
»»»s.push (5) # 元 素 人 栈 
>>>s.push(8) 

>>>s.push('a') 

>>>s.pop() # 元 素 出 栈 

a 

>>>s.push('b') 

>>>s.push('c') 

»»»s.show() # 查 看 栈 的 内 容 
[5, 8, 'b', 'c'] 

>>> s.showRerainderSpace () # 查 看 栈 的 剩余 大 小 
Stack can still PUH 6 elements. 

>>> s.setSize (3) # 修 改 栈 的 大 小 
>>>s.isFull() 

True 

»2»»s.show() 

[5, 8, 'b'] 

>>> s.setSize(5) 

>>>s.push('d') 

>>> s.push('didd') 

>>> s.pash 3) 

Stack Full! 

»»»s.show() 

[5, 8, 'b', 'd', "aaaa'] 


45 自 定义 二 叉 树 


二 叉 树 是 每 个 节点 最 多 有 两 个 子 树 ( 分 别称 为 左 子 树 和 右 子 树 ) 的 树 结构 ,二 叉 树 的 
第 i 层 最 多 有 27 "个 节点 ,常用 于 排序 或 查找 。 

例 4-6 设计 二 又 树 类 ,模拟 二 又 树 创建 插入 子 节点 以 及 前 序 遍 历 、 中 序 遍历 和 后 
序 遍历 等 遍历 方式 ,同时 还 支持 二 又 树 中 任意 子 树 的 节点 遍历 。 


def del _(self): # 析 构 函 数 


def insertleftChild(self, value): # 创 建 左 子 树 
ifself. left: 
print (Teft child tree already exists. ') 
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def insertRightChild(self, value): # 创 建 右 子 树 
if self. right: 
print ('Right child tree already exists.') 
else: 
self.  right-BinaryTree (value) 
retum self. right 


def show(self): 
print(self. data) 


def preOrder (self) : # 前 序 遍 历 
print(self. data) # 输 出 根 节点 的 值 
ifself. left: 

self. left.preOrder() # 饥 历 左 子 树 
ifself. right: 
self.  right.preOrder() # 饥 历 右 子 树 
def postOrder (self) : # 后 序 遍 历 


ifself. left: 

self.  left.postOrder () 
ifself. right: 

self.  right.postOrder() 
print(self. data) 


def inOrder (self): # 中 序 遍 历 
ifself. left: 
self. left.inorder() 
print(self. data) 
ifself. right: 
self. right.inorder() 
if nme  --' mein ': 


print ('Please use me as a module. ') Foot 


把 上 面 的 代码 保存 为 BinaryTree. py 文件 ,下 面 的 代码 创建 P S 
了 如 图 4-3 所 示 的 二 叉 树 ,并 对 该 树 进行 遍历 。 

»»»import BinaryTree D 

>>> root- BinaryTree.BinaryTree (' root!) 图 4-3 二 叉 树 

»»»b-root.insertRightChild('B') 
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»»»8-root.insertleftchild('A') 
»»»c-a.insertleftchild('C') 
»»»d-c.insertRightChild('D') 
»»»e-b.insertRightChild('E') 
»»»f-e.insertleftchild('F") 
>>> root.inOrder () 

C D A rct B F E 
>>> root.postOrder () 

DC A FE B rot 
»»»b.inorder() 

BFE 


(以 拓展 知识 ， 堆 也 是 一 种 很 重要 的 数据 结构 ,在 进行 排序 时 使 用 较 多 ,优先 队列 也 
是 堆 结构 的 一 个 重要 应 用 。 堆 是 一 个 二 又 树 , 其 中 每 个 父 节 点 的 值 都 小 于 或 等 于 其 所 有 
子 节点 的 值 。 使 用 数组 或 列表 来 实现 小 根 堆 时 ， 
heap[k] <= heap[2*k 十 1] 和 heap[k] <= heap[2*k 十 2], 并 且 整 个 堆 中 最 小 的 元 素 
总 是 位 于 二 叉 树 的 根 节 点 ,大 根 堆 与 小 根 堆 正好 相反 。 了 Python 在 heapq 模块 中 提供 了 对 


扒 的 支持 ,例如 : 


>> > import heapq 

>> > import randcm 

>>> data= randcm.sample (range (1000), 10) 
>>>data 

[638, 659, 212, 84, 737, 677, 553, 340, 526, 747] 
>> > heapq.hespify (data) 

>>> data 
[84，340，212，526，737，677，553，659，638，747] 
>>> heapq.heappush (data, 30) 

>>> data 
[30，84，212，526，340，677，553，659，638，747，737] 
>>> heapq.heappush (data, 5) 

»»»data 

[5, 84, 30, 526, 340, 212, 553, 659, 638, 747, 731, 677] 
>> > heapq.heappop (data) 

5 

>> > heapq.heappop (data) 

30 

>> > heapq.heappop (data) 

84 

>>>data 

[212, 340, 553, 526, 731, 677, 747, 659, 638] 
>> > heapq.heappushpop (data, 1000) 

212 

>>>data 


对 于 所 有 的 k( 下 标 , 从 0 开始 ) 都 满足 


# 导 入 heapq 模 块 


# 生 成 随机 测试 数据 


# 堆 化 随机 测试 数据 


# 新 元 素 人 堆 ,自动 调整 堆 结构 


# 返 回 并 删除 最 小 元 素 , 自 动 调整 堆 


# 弹 出 最 小 元 素 ,同时 新 元 素 人 堆 
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[340, 526, 553, 638, 737, 677, 741, 659, 1000] 

>>> heapq.heapreplace (data, 500) # 弹 出 最 小 元 素 ,同时 新 元 素 人 堆 
340 

»»»data 

[500, 526, 553, 638, 737, 677, 741, 659, 1000] 

>> > heapg.heapreplace (data, 700) 

500 

»»»data 

[526, 638, 553, 659, 737, 677, 747, 700, 1000] 

>>> heapq.nlargest (3, data) # 返 回 最 大 的 前 3 个 元 素 

[1000, 747, 731] 

>>> heapq-nsmallest (2, data, key- str) # 返 回 指定 排序 规则 下 最 小 的 3 个 元 素 
[1000, 526] 


426 自 定义 有 向 图 


有 向 图 由 若干 节点 和 边 组 成 ,其 中 每 条 边 都 是 有 明确 方向 的 , 即 从 一 个 节点 指向 另 一 
个 节点 。 若 有 向 图 中 两 个 节点 之 间 存 在 若干 条 有 向 边 则 表示 从 起 点 可 以 到 达 终 点 ,认为 
存在 一 条 路 径 。 

例 4-7 设计 有 向 图 类 ,模拟 有 向 图 的 创建 和 路 径 搜索 功 能 。 


class DirectedGrarh (dbject) : 
def init (self, d): 
if isinstance(d, dict): 
self. graph-d 
else: 
self. graph-dict() 
print ('Sth error') 


def — generatePath(self, graph, path, end, results): 

current- path[- 1] 
if current -— end: 

results.append (path) 
else: 

for n in graph [current] : 

ifnnot in path: 
self.  generatePath(graph, path* [n], end, results) 


def searchPath(self, start, end): 
self. results- [] 
self. generatePath(self. graph, [start], end, self. results) 
self.  results.sort (key- lambda x:len(x)) # 按 所 有 路 径 的 长 度 进行 排序 
Print ("The path fram ',self. results[0][0], ' to ', self. —results[0] 
[- 1], ' is:') 
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for path in self. results: 
print (path) 


de AC ['B', 'C', "DJ, 
"BpE, 
"Cp, ign], 
"D' pb", "ES, "8r, 


'e' pen) 
g- DirectedGraph (d) 

g.searchPath('A', 'D') 
g.searchPath('A', 'E') 


程序 运行 结果 为 


The path frm A to D is: 
w) 

“np a *D'] 

W D E D 

RSS NOS, e a a a) 

"BP, 7C5, a "GI, "EI, "D] 
The path frm A to E is: 
A B5, T 

"BS, ID, 'ES] 

*hi5, AG, p imer] 

wy "B', E] 

"n5, Apr; Gt, en] 

*B7, "C*, "D'; "B', "E'] 

"A, IC', CDI, IGI, ES] 

in*, ich, gh, pr, Sgt] 

[An 6^, e "Gt; "E 

B5, 305, gh, ph; Bt, Sg] 
A AS, gn, ip^, Sn oe] 


47 自 定义 集合 


Python 内 置 了 集合 类 型 ,支持 并 集 、 差 集 、 交 集 等 运算 ,并 且 不 允许 元 素 重 复 。 本 节 
案例 通过 封装 Python 列表 模拟 了 集合 类 ,并 提供 了 有 关 的 运算 。 
例 4-8 自 定义 集合 类 。 
# 自 定义 集合 类 
class Set (cbject) : 
def init (self, data- None) : 
Af Gata Nore: 
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self.__datæ [] 
else: 
if not hasattr (data, '__iter__'): 
# 提 供 的 数据 不 可 迭代 ,实例 化 失败 
raise Esception(" 必 须 提 供 可 迭代 的 数据 类 型 ) 
tae [] 
for item in data: 
Lupe SALLE 
# 这 里 的 可 哈 希 与 第 14 章 介绍 的 安全 哈 希 算法 并 不 一 样 
hash (item) 
if not item in temp: 
temp.append (item) 
self.  data- temp 


# 析 构 函 数 
def del (self): 
delself. data 


# 添 加 元 素 ,要 求 元 素 必须 可 哈 希 
def add(self, value): 
hash (value) 
if value not inself. data: 
self.  data.append(value) 
else: 
print (元 素 已 存在 ,操作 被 忽略 ) 


# 删 除 元 素 
def remove (self, value): 
if value inself. data: 
self.  data.remove (value) 
print ("删除 成 功 *) 
else: 
print(' 元 素 不 存在 ,删除 操作 被 忽略 ') 


# 随 机 弹出 并 返回 一 个 元 素 
def Pop (self): 
ifnotself. data: 
print( 嘛 合 已 空 ,弹出 操作 被 忽略 ') 
retum 
import randam 
item-randm.choice(self. data) 
print (item) 
self.  data.remove (item) 
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# 运 算 符 重 载 ,集合 差 集运 算 
def sub (self, anotherSet): 
if not isinstance (anotherSet, Set): 
raise Exception ("2E 98 RHR *) 
# 空 集合 
result- Set() 
# 如 果 一 个 元 素 属 于 当前 集合 而 不 属于 另 一 个 集合 ,添加 
foriteminself. data: 
if item not inanotherSet. data: 
result. — data.append(item) 
return result 


# 提 供 方法 ,集合 差 集运 算 
def difference (self, anotherSet): 
if not isinstance (anctherSet, Set): 
raise Exception('" 类 型 错误 ) 
retum self- anotherSet 


#| 运 算 符 重 载 ,集合 并 集运 算 
def or (self, anotherSet): 
if not isinstance (anotherSet, Set): 
raise Exoeption(' 类 型 错误 ') 
result-Set(self. data) 
for iteminanotherSet. data: 
if item not in result. — data: 
result. —deta.append(item) 
return result 


# 提 供 方 法 ,集合 并 集运 算 
def union(self, anotherSet): 
if not isinstance (anotherSet, Set): 
raise Exoeption(' 类 型 错误 ') 
retum self | anotherSet 


#& 运 算 符 重 载 ,集合 交集 运算 
def and (self, anotherSet): 
if not isinstance (anotherSet, Set): 
raise Exoeption(' 类 型 错误 ') 
result- Set () 
foriteminself. data: 
ifiteminanotherSet. data: 
result. _data.append (item) 
retum result 


# 运 算 符 重 载 ,集合 对 称 差 集 
def xor _ (self, anotherSet): 
return (self- anotherSet) | (anotherSet- self) 


# 提 供 方法 ,集合 对 称 差 集运 算 
def symetric difference (self，anotherSet) : 
if not isinstance (anotherSet, Set): 
raise Exoeption(' 类 型 错误 ') 
return self ^ anotherSet 


== 运 算 符 重 载 ,判断 两 个 集合 是 否 相等 
def eq _(self, anotherset): 

if not isinstance (anotherSet, Set): 
raise Excepticn(" 类 型 错误 ) 

if sorted(self. _data)== sorted(anotherSet. ^ data): 
return True 

else: 
return False 


#> 运 算 符 重 载 ,集合 包含 关系 
def gt (self, anotherSet): 
if not isinstance (anotherSet, Set): 
raise Exoeption(' 类 型 错误 ') 
if self != anotherSet: 
flagl= True 
for item in self. data: 
if item not in anotherSet. — data: 
# 当 前 集合 中 有 的 元 素 不 属于 另 一 个 集合 
flagl- False 
break 
flag True. 
for iteminanotherSet. — data: 
ifitemnotin self. data: 
# 另 一 个 集合 中 有 的 元 素 不 属于 当前 集合 
flag False 
break 
if not flagl and flag?: 
return True 
return False 


#>= 运 算 符 重 载 ,集合 包含 关系 
def ge (self, anotherSet) : 
if not isinstance (anotherSet, Set): 
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raise Exception (' H HHR ") 
retum self--anctherSet or self» anotherSet 


# 提 供 方法 ,判断 当前 集合 是 否 为 另 一 个 集合 的 真子 集 
def issubset (self, anotherSet): 
if not isinstance (anotherSet, Set): 
raise Exception (JE YI RHR ") 
if self« anotherSet: 
retum True 
else: 
return False 


# 提 供 方法 ,判断 当前 集合 是 否 为 另 一 个 集合 的 超 集 
def issuperset (self, anotherSet): 
if not isinstance (anotherSet, Set): 
raise Exception(" 类 型 错误 ) 
if self» anotherSet: 
return True 
else: 
return False 


# 提 供 方法 ,清空 集合 所 有 元 素 
def clear (self): 
while self. data: 
delself. data[-1] 
print (" 集 合 已 清空 ) 


# 运 算 符 重 载 ,使 得 集合 可 和 迭代 
def iter (self): 
return iter(self. data) 


# 运 算 符 重 载 ,支持 ip 运算 符 
def contains — (self, value): 
ifvalue inself. data: 
return True 
else: 
return False 


# 支 持 内 置 函数 len() 
def len (self): 
returnlen(self. data) 


# 直 接 查看 该 类 对 象 时 调用 该 函数 


163 
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def repr (self): 
retum '{'+str(self. data) [1:- 1]+ '}' 


HEJ print 0 函数 输出 该 类 对 象 时 调用 该 函数 
def str (self): 
return '(tstr(self. data) [1:-1]+ ')' 


把 这 个 文件 保存 成 mySet. py, 然 后 就 可 以 像 下 面 的 代码 这 样 使 用 自 定义 集合 类 了 。 


> > > fram mySet import Set # 导 入 自 定义 集合 类 
»»»x-Set (range (10)) # 创 建 集合 对 象 
>>> y-Set(range(8, 15)) 

»»»z-Set([l, 2, 3, 4, 5]) 

>>>x 

1 2, 3, 4,5, €, 1, 8,9) 

>>>y 

I8, 9, 30, 11, 12, 13, 14] 

>>>z 

(1, 2, 3, 4, 5) 

>>> z.add(6) # 增 加 元 素 
>>>z 

(1,2,3,4,5, 6) 

»»»z.remove(3) # 删 除 指定 元 素 
删除 成 功 

>>>z 

152,4, 5, €f 

>>>Y-pop() # 随 机 删除 一 个 元 素 
11 

>>>x-y # 差 集 

19, 1, 2,3, 4.5, 6, 1) 

>>>x-2z 

(0, 3, 7, 8, 9) 

»»»x.difference (y) 

19, 1, 2, 3, 4, 5, 6, 1) 

>>>x| y # 并 集 

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 13, 14] 

»»»x.union(y) 


10, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 13, 14} 


>>>X&Z # 交 集 
ü, 2, 4, 5, 6) 
»»»x^z # 对 称 差 集 


10, 3, 7, 8, 9) 

»»»x.symetric difference (y) 

t0, 1, 2, 3, 4, 5, 6, 7, 10, 12, 13, 14} 
>>> &-yliy-3 
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10, 1, 2, 3, 4, 5, 6, 7, 10, 12, 13, 14] 
»»»x--y # 测 试 两 个 集合 是 否 相 等 


>>>zPY # 测 试 集合 包含 关系 


v v 


v 
Pid 
v 
x 
M 
M 
N 


>>> z.issubset (x) # 测 试 > 是 否 为 x 的 子 集 


d 


HUR x 是 否 为 z 的 超 集 


f 
| 


# 测 试 集合 中 是 否 存在 某 个 元 素 


v 
M 
v 
w 
n 
x 


VEI 
v v 
8 
io 


# 计 算 集 合 中 元 素 个 数 


o 


»»»y.clear() 

集合 已 清空 

>>>Y-Pop() 

集合 已 空 ,弹出 操作 被 忽略 


5.1 字 符 Hm 


最 早 的 字符 串 编码 是 美国 标准 信息 交换 码 ASCII, 仅 对 10 个 数字 、26 个 大 写 英文 字 
母 .26 个 小 写 英 文字 母 及 一 些 其 他 符号 进行 了 编码 。ASCII 采用 1 个 字 节 来 对 字符 进行 
编码 ,最 多 只 能 表示 256 个 符号 。 

随 着 信息 技术 的 发 展 和 信息 交换 的 需要 .各国 的 文字 都 需要 进行 编码 ,不 同 的 应 用 领 
域 和 场合 对 字符 串 编码 的 要 求 也 略 有 不 同 , 于 是 分 别 设计 了 不 同 的 编码 格式 ,常见 的 主要 
有 UTF-8,UTF-16, UTF-32,GB2312, GBK,CP936,base64,CP437 等 。UTF-8 编码 是 国 
际 通用 的 编码 ,以 1 个 字 节 表示 英语 字符 (兼容 ASCID ,以 3 个 字 节 表示 中 文 ,还 有 些 语 
言 的 符号 使 用 2 个 字 节 (如 俄语 和 希腊 语 符号 ) 或 4 个 字 节 ,UTF-8 对 全 世界 所 有 国家 需 
要 用 到 的 字符 进行 了 编码 。GB2312 是 我 国 制定 的 中 文 编码 ,使 用 1 个 字 节 表示 英语 ， 
2 个 字 节 表示 中 文 ;GBK 是 GB2312 的 扩充 ,而 CP936 是 微软 公司 在 GBK 基础 上 开发 的 
编码 方式 。GB2312、GBK 和 CP936 都 是 使 用 2 个 字 节 表示 中 文 ,UTF-8 使 用 3 个 字 节 
表示 中 文 。 不 同 编 码 格式 之 间 相 差 很 大 ,采用 不 同 的 编码 格式 意味 着 不 同 的 表示 和 存储 
形式 ,把 同一 字符 存 人 文件 时 , 写 人 的 内 容 可 能 会 不 同 , 在 理解 其 内 容 时 必须 了 解 编码 规 
则 并 进行 正确 的 解码 。 如 果 解 码 方法 不 正确 就 无 法 还 原 信息 ,从 这 个 角度 来 讲 , 字 符 串 编 
码 也 具有 加 密 的 效果 。 

Python 3. x 完全 支持 中 文 , 使 用 Unicode 编码 格式 ,无 论 是 一 个 数字 、 英 文字 母 ,还 
是 一 个 汉字 ,都 按 一 个 字符 对 待 和 处 理 。 例 如 ,在 Python 3. 5. 1 中 执行 下 面 的 代码 ,从 代 
码 中 可 以 看 到 ,在 Python 3. x 中 甚至 可 以 使 用 中 文 作为 变量 名 。 

»»»s-'UBB ARE ' 

>>> len(s) # 字 符 串 长 度 ,或 者 包含 的 字符 个 数 

6 

>>> s 'SDIBT' 

>>> len(s) 

5 

»»»s- ' 中 国 山东 烟台 soer # 中 文 与 英文 字符 同样 对 待 都 算 一 个 字符 

>>> len(s) 

u 

>>> 姓 名 = ' 张 三 ' # 使 用 中 文 作为 变量 名 
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s 


>>> 年 龄 =40 

»»»print 姓名 ) # 输 出 变量 的 值 
张 三 

>>>print 人 年龄 ) 

40 


KAMER: 在 Windows 平台 上 使 用 Python 2. x 时 ,input() 函 数 从 键盘 输入 的 字 
符 串 默认 为 GBK 编码 ,而 Python 程序 中 的 字符 串 编 码 则 使 用 # coding 显 式 地 指定 , 常 
用 的 方式 有 : 


#coding= utf- 8 

scoding:utf- 8 

#- * —ooding:utf- 8 - * 一 

在 Python 中 ,字符 串 属于 不 可 变 序列 类 型 ,使 用 单 引号 (这 是 最 常用 的 )、 双 引号 、 三 
单 引 号 或 三 双 引 号 作为 界定 符 , 并 且 不 同 的 界定 符 之 间 可 以 互相 嵌 套 。 下 面 几 种 都 是 合 


法 的 Python 字符 串 : 
"abc', '123'、 "中 国 ' "Python", Tom said,"Iet's gon" 


除了 支持 序列 通用 方法 (包括 双向 索引 ,比较 大 小 、 计 算 长 度 、 元 素 访 问 、 切 片 等 操作 ) 
以 外 ,字符 串 类 型 还 支持 一 些 特有 的 操作 方法 ,如 格式 化 .字符 串 查找 .字符 串 蔡 换 ( 注 意 ， 
不 是 原 地 替换 ) ,排版 等 。 但 由 于 字符 串 属于 不 可 变 序 列 ,不 能 直接 对 字符 串 对 象 进行 元 
素 增加 ,修改 与 删除 等 操作 。 另 外 ,字符 串 对 象 提供 的 replace() 和 translate() 方 法 也 不 
是 对 原 字符 串 直 接 进 行 修改 替换 ,而 是 返回 一 个 修改 蔡 换 后 的 新 字符 串 作 为 结果 。 

Python 支持 短 字符 串 驻 留 机 制 , 对 于 短 字符 串 .将 其 赋值 给 多 个 不 同 的 对 象 时 ,内 存 
中 只 有 一 个 副本 ,多 个 对 象 共享 该 副本 ,与 其 他 类 型 数 有 具有 相同 的 特点 。 然 而 ,这 一 点 并 
不 适用 于 长 字符 串 ,长 字符 串 不 遵守 驻 留 机 制 , 下 面 的 代码 演示 了 短 字 符 串 和 长 字符 串 在 
这 方面 的 区 别 。 


»»»a-'1234' 

»»»b-'1234' 

»»»id(a--id() # 短 字符 串 支持 内 存 驻 留 机 制 
True 

»»»a-'1231' * 50 

»»»b-'1231'* 50 

»»»id(g--id( # 长 字符 串 不 支持 内 存 驻 留 机 制 
False 


如 果 需 要 判断 一 个 变量 是 否 为 字符 串 ,可 以 使 用 内 置 方法 isinstanceO k typeO 。 
>>>type(' 中 国 ') 

<class 'str'> 

>>> type ("H [E '.enoode('gbk')) # 编 码 成 字 节 串 ,采用 GE 编码 格式 

«class 'bytes'» 


»»»bytes 

«class 'bytes'» 
»»»isinstance('P Ed] ', str) 
True 
>>>type(" 中 上 
True 
>>>type(" 中 国 '.encode 0))==bytes 
True 

>>> type("H H )-- bytes 

False 
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#bytes J& Python 的 内 置 类 


(QARAR: 转 义 字符 。 如 果 大 家 学 习 过 其 他 语言 ,应 该 了 解 转 义 字符 的 概念 ,可 
以 跳 过 这 部 分 内 容 。 转 义 字符 是 指 ,在 字符 囊 中 茶 些 特定 的 符号 前 加 一 个 针线 之 后 该 宁 
符 将 被 解释 为 另外 一 种 含义 ,不 再 表示 本 来 的 字符 。 常 见 的 转 义 字符 如 表 5-1 所 示 。 


表 5-1 常见 的 转 义 字 符 
转 义 字符 * x 
\b 3B f ,把 光标 移动 到 前 一 列 位 置 
M 换 页 符 
in 换行 符 
\r [ES 
M 水 平 制 表 符 
Ww 垂直 制 表 符 
b 一 个 \ 
by 单 引号 
y“ 双 引 号 
\ooo 3 位 八进制 数 对 应 的 字符 
\xhh 2 位 十 六 进 制 数 对 应 的 字符 
\uhhhh 4 位 十 六 进 制 数 表示 的 Unicode 字符 
下 面 的 代码 演示 了 转 义 字符 的 用 法 : 
»»» print ('"HelloNrorld") # 包 含 转 义 字符 的 字符 串 
Hello 
World 
»»»oct(65) 
"00101" 
»»»print ("M01") #3 位 八进制 数 对 应 的 字符 


A 
>>> hex(65) 
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s 


"Ox" 
>>>print('\x41') #2 位 十 六 进 制 数 对 应 的 字符 

A 

>>>ord(' 董 ') 

33891 

»»»hex() 

,0x8463， 

»»»print ('Nu8463") #4 位 十 六 进 制 数 表示 的 Unicode TF 
董 


511 字符 串 格式 化 的 两 种 形式 


如 果 需 要 将 其 他 类 型 的 数据 转换 为 字符 串 ,或 者 蔡 入 其 他 字符 串 或 模板 中 再 进行 输 
出 ,就 需要 用 到 字符 串 格式 化 。Python 中 字符 串 格 式 化 的 格式 如 图 5-1 所 示 , 格 式 运 算 
符 % 之 前 的 部 分 为 格式 字符 串 , 之 后 的 部 分 为 需要 进行 格式 化 的 内 容 。 


% 中 DH [0] [m] Ln]. 格式 字符 % x 


t (D 待 转换 的 表达 式 。 
(2) 格式 运算 符 。 
(3) 指定 类 型 ， 见 表 5-2。 


(4) 指定 精度 。 

(5) 指定 最 小 宽度 。 

(6) 指定 空位 填 0。 

C) 对 正 数 加 正 号 。 

(8) 指定 左 对 齐 输 出 

(9) 格式 标志 ， 表 示 格 式 开始 。 


图 5-1 字符 串 格式 化 


Python 支持 大 量 的 格式 字符 , 表 5-2 列 出 了 比较 常用 的 一 部 分 。 


表 5-2 格式 字符 
格式 字符 LE 
%s 字符 串 (采用 stO B 
%r 字符 串 ( 采 用 repr() 的 显示 ) 
%e 单个 字符 
%b 二 进 制 整数 
%d 十 进 制 整数 
%i 十 进 制 整数 
%o 八进制 整数 
Wx 十 六 进 制 整数 
“e 指数 (基底 写 为 e) 
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续 表 


格式 字符 说 明 

AE 指数 (基底 写 为 E) 

AEAF 浮 点 数 

%g 指数 (e) 或 浮 点 数 (根据 显示 长 度 ) 
6nG 指数 (E) 或 浮 点 数 (根据 显示 长 度 ) 
596 字符 "%" 


下 面 的 代码 演示 了 字符 串 格式 化 的 用 法 : 


2»»x-1235 
2»»so0-"$0" $x 
>>> so 
12323" 
>>> shF "bx" $x 
>>> sh 
"Ad3* 
>>> sæ "$e" $x 
>>> se 
*1.235000e* 03' 
>>>"%s"$65 # 等 价 于 str() 
"65， 
>> > "%3"%65333 
165333" 
>>> '%d,%c'% (65, 65) # 使 用 元 组 对 字符 串 进 行 格式 化 , 按 位 置 进行 对 应 
'65,A' 
»»»"&d"i"555" BUSES RE tp Pe Be J Hi EG M tH , 抛 出 异常 
Traceback (most. recent. call last): 
File "< pyshell#19>", line 1, in «module» 
"Sans "555" 
TypeError: $d format: a number is required, not str 
»»»int('555") # 可 以 使 用 imt0 函 数 将 合法 的 数字 字符 串 转 换 为 整数 
555 
>>> '%s'%[1, 2, 3] 
'i, 2, 31" 
>>>str((l, 2, 3) # 可 以 使 用 str() 函 数 将 任意 类 型 数据 转换 为 字符 串 
"(1 2, 3)' 
>>> str([1, 2, 3]) 
"E, 2, 37 


除了 上 面 介绍 的 字符 串 格式 化 方法 ,目前 Python 社区 更 推荐 使 用 format O Jr iE 3t 
行 格式 化 ,该 方法 更 加 灵活 ,不 仅 可 以 使 用 位 置 进行 格式 化 ,还 支持 使 用 与 位 置 无 关 的 参 
数 名 字 来 进行 格式 化 ,并 且 支 持 序列 解 包 格 式 化 字符 串 ,为 程序 员 提供 了 非常 大 的 方便 。 
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s 
例如 ， 


>>>print (' (0: 3£)' format (1/3)) # 保 留 3 位 小 数 

0.333 

2221/3 

0.3333333333333333 

>>>print ("Ihe number (0:,) in hex is: {0:#x}, in oct is (0:f0)".format (55)) 

The number 55 in hex is: 0x37, in oct is 0067 

>>>print ("Ihe nnker (0:,) in hex is: (0:x), the number {1} in oct is (1:0)".format (5555, 55)) 
The number 5,555 in hex is: 153, the number 55 in oct. is 67 

>>>print ("Ihe number (1) in hex is: {1:#x}, the number (0) in oct is (0:£0)".format (5555, 55)) 
The number 55 in hex is: 0x37, the number 5555 in oct is 0012663 

>>>print ("my name is (name), my age is (age), and my Q is (qg)". format (name= "Dong", qq= "306467355", 
age- 38)) 

my name is Dong, my age is 38, and my QQ is 306467355 

»»»position = (5, 8, 13) 

>>>print ("X: (0[0] ):Y: (0[1]);2: (0[2] )". format (position)) 


# 使 用 元 组 同时 格式 化 多 个 值 
X:5;Y:8;2:13 
>>> weather= [ ("Monday", "rain"), ("Tuesday", "sunny"), ("Wednesday", "sunny"), ("Thursday", "rain"), (" 
Friday", "Cloudy")] 


>>> fomatter= "Weather of '(0[0])' is '(0[1]] '".format 
>>> for item in map(formatter, weather): 

print (item) 
上 面 最 后 一 段 代 码 也 可 以 改 为 下 面 的 写法 : 
>>> for item in weather: 

print (formatter (item)) 


运行 结果 为 

Weather of 'Monday' is 'rain' 

Weather of "Tuesday' is 'sunny' 

Weather of 'Wednesday' is 'sunny' 

Weather of "Ihursday' is 'rain' 

Weather of 'Friday' is 'Cloudy' 

QARMR: 在 字符 串 格式 化 方法 format() 中 常用 的 格式 字符 。 在 字符 串 格式 化 
方法 format() 中 可 以 使 用 的 格式 主要 有 b( 二 进 制 格式 ) .c( 把 整数 转换 成 Unicode 字 
符 )、d( 十 进 制 格式 )、o( 八 进 制 格式 )、x( 小 写 十 六 进 制 格 式 )、X( 大 写 十 六 进 制 格式 ) e/E 
(科学 计数 法 格式 ) 、f/F( 固 定 长 度 的 浮 点 数 格式 )、%( 使 用 固定 长 度 浮 点 数 显示 百分数 )。 

(QARAR: Python 标准 库 string 还 提供 了 用 于 字符 串 格式 化 的 模板 类 
Template。 例 如 : 


>>> fra string import Template 
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»»»t-Temlate ('My name is $ {nawe}, and is $ (age) years old. ') 
# 创 建 模板 

>>> È ('name':'Dong', 'age':39} 

»»» t.substitute (d) UHR 

"My name is Dong, and is 39 years old." 

>>>tt= Template ('My name is $ name, and is $ age years old.') 

>>> tt.substitute (d) 

My nae is Dong, and is 39 years old." 


512 字符 串 常 用 方法 


1. findO ,rfindO ,indexO ,rindexO count) 


find O F rfind() 方 法 分 别 用 来 查找 一 个 字符 串 在 另 一 个 字符 串 指 定 范围 (默认 是 整 
个 字符 串 ) 中 首次 和 最 后 一 次 出 现 的 位 置 ,如 果 不 存在 则 返回 一 1;index() 和 rindex() 方 


>>> s= "apple, peach, banana, peach, pear" 


>>> s.find("peach") # 返 回 第 一 次 出 现 的 位 置 
> 7) # 从 指定 位 置 开始 查找 
uL 7, 20) # 在 指定 范围 中 进行 查找 
SNC # 从 字符 串 尾部 向 前 查找 
M # 返 回首 次 出 现 的 位 置 


x 
»»»s.index('pe') 
6 
»»»Ss.index('pear') 
25 
»»»s.index('ppp') # 指 定子 字符 串 不 存在 时 抛 出 异常 
Traceback (most recent call last): 
File "«pyshell£ll»", line 1, in «module» 
s.index('pep') 
ValucError: substring not found 
»»»s.count ('p') # 统 计 子 字符 串 出 现 的 次 数 
5 
>>> s.coumt ('pp!) 
1 
»»»s.count ('ppp') # 不 存在 时 返回 0 
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s 
0 


(QARAR: 实际 开发 时 应 优先 考虑 使 用 Python 内 置 函 数 和 内 置 对 象 的 方法 , 运 
行 速度 快 ,并 且 运 行 稳定 。 例如, 下面 的 代码 用 来 检查 长 字符 囊 中 哪些 位 置 上 的 字母 是 
a, 通 过 运行 结果 可 以 发 现 ,使 用 字符 串 方 法 find() 的 速度 明显 要 比 逐 个 字符 比较 快 很 多 。 


fram string import ascii letters 
fram randam import choice 


letters- ''.join([choice(ascii letters)for i in range (999999) ]) 
def positions of character (sentence, ch): # 使 用 字符 串 对 象 的 find() 方 法 
result- [] 
index-0 
index- sentence.find(ch, index 1) 
while index !- - 1: 
result.append (index) 
index- sentence.find(ch, index 1) 
retum result 


def demo(s, c): # 普 通 方法 ,逐个 字符 比较 
result- [] 
for i,ch in enumerate (3) : 
if h==c: 
result.append(i) 
return result 


start- time () 
positions- positions of character (letters, 'a') 
print (time ()- start) 


start- time () 
p daw (letters, 'a') 
print (time ()- start) 


运行 结果 如 下 : 

0.009000539779663086 

0.08400487899780273 

速度 居然 相差 10 倍 左右 ,看 来 内 置 对 象 提供 的 方法 还 真是 不 错 , 简 直 是 人 见 人 爱 , 花 
见 花 开 。 但 是 不 要 高 兴 太 早 ,一切 都 是 相对 的 ,这 世间 没有 绝对 得 好 ,也 没有 绝对 得 坏 ,内 
管 对 象 的 某 些 方法 也 不 是 在 任何 场合 都 能 保证 最 优 。 例 如 把 上 面 代码 中 的 


letters- ''.join([choice(ascii letters)for i in range (999999) ]) 
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BON 
letters- '' join ([choice('ab')for i in range (999999) ]) 


然后 再 次 运行 ,会 发 现 结果 与 上 面 的 代码 恰好 相反 ,逐个 比较 的 方法 又 比 使 用 findO Jr i 
快 了 很 多 。 稍 加 分 析 可 以 发 现 ,上 面 两 段 代码 是 完全 一 样 的 ,只 是 所 查找 数据 的 密度 不 一 
PE ,处 理 速度 却 有 着 翻天 覆 地 的 变化 。 所 以 说 ,首先 要 分 析 待 处 理 的 数据 有 什么 样 的 特点 
(包括 组 成 元 素 、 分 布 情况 等 ) ,然后 才能 设计 最 优 的 算法 并 采用 最 高 效 的 方法 。 但 一 般 情 
ULF Python 内 置 函 数 ,内 置 对 象 的 方法 和 标准 库 对 象 的 效率 要 高 于 自己 编写 的 代码 。 


2. split() .rsplit( ,partitionC) ,rpartition() 


split O PI rsplit() 方 法 分 别 用 来 以 指定 字符 为 分 隔 符 , 从 字符 串 左 端 和 右 端 开始 将 其 
分 隔 成 多 个 字符 串 ,并 返回 包含 分 隔 结果 的 列表 ;partition() 和 rpartition() 用 来 以 指定 字 
符 串 为 分 隔 符 将 原 字符 串 分 隔 为 3 部 分 , 即 分 隔 符 之 前 的 字符 串 、 分 隔 符 字 符 串 和 分 隔 符 
之 后 的 字符 串 ,如果 指 定 的 分 隔 符 不 在 原 字 符 串 中 , 则 返回 原 字符 串 和 两 个 空 字符 串 。 


>>> s "apple,peach,banana,pear" 


>>> li=s.split(",") # 使 用 逗号 进行 分 隔 
>>>li 

["apple", "peach", "banana", "pear"] 

>>>s.partition(', ') # 从 左 侧 使 用 逗号 进行 切 分 
('apple', ',', 'peach,banana, pear") 

>>> s.rpartition(', ') # 从 右 侧 使 用 逗号 进行 切 分 
('apple,peach,banana', ',', 'pear') 

»»»s.rartition('banana') # 使 用 字符 串 作为 分 隔 符 


('agple,peach,', 'banana', ',pear') 
>>> s-"2014- 10- 31" 


»»»t-s.split ("- ") # 使 用 指定 字符 作为 分 隔 符 
>>>t 

['2014', 10*, '31*] 

»»»list(mp(nt, t)) # 将 分 隔 结果 转换 为 整数 


[2014, 10, 31] 


对 于 splitO fI rsplit ) 方 法 ,如 果 不 指定 分 隔 符 , 则 字符 串 中 的 任何 空白 符号 (包括 


空格 ,换行 符 、 制 表 符 等 ) 的 连续 出 现 部 将 被 认为 是 分 隔 符 ,返回 包含 最 终 分 隔 结 果 的 
列表 。 


>>> s 'hello world \n\n My name is Dong 
»»»s.split() 

['hello', 'world', 'My', 'name', 'is', 'Dong'] 

>>> s '\n\nhello world \n\n\n My name is Dong 
»»»s.split() 

['hello', 'world', 'My', 'name', 'is', 'Dong'] 
22»»s-'WNnbelloNVtAt world \n\n\n My name\t is Dong 


174 E Python 可 以 这 样 学 
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»»»s.split( 
['bello', 'world', "My', "name', 'is', 'Dong'] 


另外 ,split() 和 rsplit ) 方 法 还 允许 指定 最 大 分 隔 次 数 ( 注 意 ,不 是 必须 分 隔 这 么 多 


次 ) ,例如 : 


>>>s="\n\nhello\t\t world \n\n\n My name is Dong ' 
>>>s.split (rxsplit- 1) # 分 隔 1 次 
"hello', 'world \n\n\n My rame is Dong — '] 

>>> s.rsplit (maxsplit- 1) 

"\n\nhello\t\t world \n\n\n My nare is', 'Dong'] 

>>> 5.split (maxsplit- 2) 

"hello', 'world', 'My nae is Dong '] 

>>> s.rsplit (maxsplit- 2) 

'\n\nhello\t\t world \n\n\n My name', 'is', 'Dong'] 

>>> s.split (maxsplit- 5) 

"hello', 'world', 'My', mname', 'is', "Dong '] 

>>> s.split (maxsplit- 6) 

'hello', 'world', 'My', 'name', 'is', 'Dong'] 

>>> s.split (maxsplit- 10) # 最 大 分 隔 次 数 大 于 实际 可 分 隔 次 数 时 ,自动 忽略 
"hello', 'world', 'My', 'name', 'is', 'Dong'] 


KLANER: 调用 split 〇 方法 并 且 不 传递 任何 参数 时 ,将 使 用 任何 空白 字符 作为 分 隔 


符 , 如 果 字 符 串 存在 连续 的 空白 字符 ,split() 方 法 将 自动 忽略 ;明确 传递 参数 指定 split() 使 


用 的 分 隔 符 时 ,情况 略 有 不 同 。 
>>> 'a, Eb, coc! split(',") # 每 个 逗号 都 被 作为 独立 的 分 隔 符 
['a*, **, "^, 'bb', '*, 'coc"] 
>>> 'a\t\t\tbb\t\tocc' .split ('\t') # 每 个 制 表 符 都 被 作为 独立 的 分 隔 符 
[ni ity 55, pps, 66, Soi] 
>>> 'a tA UA tA tooc! .split () # 连 续 多 个 制 表 符 被 作为 一 个 分 隔 符 


['a', ‘Hb', 'coc'] 


3. join() 
与 split() 相 反 ,join() 方 法 用 来 将 列表 中 多 个 字符 串 进 行 连接 ,并 在 相 邻 两 个 字符 串 


之 间 插 入 指定 字符 。 


>>> li= ["apple", "peach", "banana", "pear"] 
>>>sep="," 

»»»s-sep.join(li) # 使 用 逗号 作为 连接 符 
-»»8 

"apple, peach, banana, pear" 

»»»':'.join(i) # 使 用 冒号 作为 连接 符 
'apple:peach:banana pear 
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>>> ".join(li) # 使 用 空 字符 作为 连接 符 
'applepeactbananapear ' 


器 小 技巧 : 使 用 split() 和 join() 方 法 可 以 删除 字符 事 中 多 余 的 空白 字符 ,如 果 有 连 
续 多 个 空白 字符 ,只 保留 一 个 ,例如 : 


»»»x-'aaa bb cde fff P 
>>>' '.join(x.split()) 
'aaa bb c d e fff" 
>>> def equavilent(sl, s2): # 判 断 两 个 字符 串 在 Python 意义 上 是 否 等 价 
if s1 ==32: 
return True 
elif ' '.join(sl.split())--' '.join(s2.split ()): 
retum True 
elif ''.join(sl.split ())-- ''.join(s2.split()): 
return True 
else: 
return False 
»»»equavilent('piplist', 'pip ^ list!) 


d 


»»»eqavilent('[1, 2, 3]', '(,2,3]*) # 判 断 两 个 列表 写法 是 否 等 价 


d 


»»»eqguavilent('[1, 2, 3]', '[1,2 ,3]') 


d 


>>>eqavilent('[1, 2, 3]', '(1, 2 ,3]') 


d 


»»»equvilent('[l, 2, 3]', '[1, 2 ,3,4]") 

False 

您 注意 : 使 用 运算 符 “ 十 ”也 可 以 连接 字符 串 , 但 该 运算 符 涉及 大 量 数据 的 复制 , 效 
率 非 常 低 , 不 适合 大 量 长 字符 串 的 连接 。 下 面 的 代码 演示 了 运算 符 “ 十 ”和 字符 串 对 象 
join() 方 法 之 间 的 速度 差异 。 

import timeit 


# 使 用 列表 推导 式 生成 10000 个 字符 串 
strlist- ['This is a long string that will not keep in memory.' for n in range(10000)] 


# 使 用 字符 串 对 象 的 join() 方 法 连接 多 个 字符 串 
def use join() : 
return ''.join(strlist) 


# 使 用 运算 符 "+ "连接 多 个 字符 串 
def use plus(): 
result- '' 
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it mme _=='_ min ' 
# 重 复 运行 次 数 
times- 1000 
jointimer-timeit.Timer('use join()', 'fram ^ main _ import use join') 
print('time for join:', jointimer.timeit (nnber= times)) 
plustimer-timeit.Timer('use plus()', 'fraom — main _ import use plus') 
print ('time for plus:', plustimer.timeit (number- times) 


该 代码 分 别 使 用 join O 函数 和 “十 ”对 10000 个 字符 串 进行 连接 ,并 重复 运行 1000 
次 ,然后 输出 每 种 方法 所 使 用 的 时 间 ,运行 结果 为 


time for join: 0.11133914429192587 
time for plus: 1.6754796186748913 


( 忌 拓 展 知识 : timeit 模块 还 支持 下 面 代码 演示 的 用 法 ,从 运行 结果 可 以 看 出 , 当 需 
要 对 大 量 数据 进行 类 型 转换 时 ,内 置 函 数 map() 可 以 提供 非常 高 的 效率 。 

>>> inport timit 

>>> timeit.timeit('™"- ".join(str(n)for n in range (100)) ', number= 10000) 

# 重 复 运行 10000 次 

0.3063435900577929 

»»»timeit.timeit ('"- ".join([str (n) for n in range (100) ]) ', nunber- 10000) 

0.27191914957273866 

»»»timeit.timeit ('"- ".join(map(str, range (100)))', number- 10000) 

0.21119518171659024 


4. lowerO ,upperO ,capitalizeO title() .swapcase( ) 


这 几 个 方法 分 别 用 来 将 字符 串 转换 为 小 写 . 大 写字 符 串 ,将 字符 串 首 字母 变 为 大 写 、 
将 每 个 单词 的 首 字母 变 为 大 写 以 及 大 小 写 互 换 , 这 几 个 方法 都 是 生成 新 字符 串 ,并 不 对 原 
字符 串 做 任何 修改 。 

>>> s= "What is Your Name?" 

»»»s2-s.lower() # 返 回 小 写字 符 串 

>>>s2 

"what is your name? ' 


»»»s.uper() # 返 回 大 写字 符 串 
»»»s.cepitalize() # 字 符 串 首 字 符 大 写 


"What is your name? ' 
»»»s.title() # 每 个 单词 的 首 字母 大 写 
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"What Is Your Name? ' 
>>> s.swapcase () # 大 小 写 互 换 
"WHAT IS yOUR nAME? ' 


5. replace() 
该 方法 用 来 蔡 换 字符 串 中 指定 字符 或 子 字 符 串 的 所 有 重复 出 现 ,每 次 只 能 蔡 换 一 个 


>> "HH, pE" 

>>>s 

' 中 国 ,中国 ' 

>>>print(s) 

中 国 , 中 国 

>>>print (s.replace(" 中 国 ", "中 华人 民 共 和 国 ")) 
中 华人 民 共 和 国 ,中 华人 民 共 和 国 

>>>print ('abodabc' .replace ('abc', 'ABC')) 
ABOdABC 


6. maketransO ,translate() 


maketrans() 方 法 用 来 生成 字符 映射 表 ,而 translate() 方 法 则 按 映射 表 中 定义 的 对 应 
关系 转换 字符 串 并 蔡 换 其 中 的 字符 ,使 用 这 两 个 方法 的 组 合 可 以 同时 处 理 多 个 不 同 的 字 


符 ,replace( ) 方 法 则 无 法 满足 这 一 要 求 。 下 面 的 代码 演示 了 这 两 个 方法 的 用 法 ,当然 也 可 
以 定义 自己 的 字符 映射 表 , 然 后 用 来 对 字符 串 进行 加 密 。 


# 创 建 映射 表 ,将 字符 "abodef123" 一 一 对 应 地 转换 为 "uvwxyz@ 45 " 

>>> table= '' .maketrans ('abodef123', 'uvwxyze $$ ') 

>>> = "Python is a greate programming language. I like it!" 

>>> s.translate (table) # 按 映射 表 进 行 替换 
"Python is u gryuty progrumming lunguugy. I liky it!" 

# 下 面 的 代码 模拟 了 恺 撤 加 密 算 法 

# 每 个 英文 字母 替换 为 字母 表 中 后 面 第 3 个 字母 ,当然 ,3 也 可 以 是 其 他 数字 
>>> import string 

>>> lwerletters= string.ascii lowercase 

»»»upperletters- string.ascii uppercase 

»»»kefore- lowerletters* upperLetters 

»»»before 

'abodefghi jkImoparstuvwxyzABCDEFGHIOKIMNOECRSTUVWAYZ ' 

# 循 环 移 位 

>>> after= lowerietters 3: ]- lowerletters[:3]t* uper etters [3: ]| ugperietters [:3] 
»»»after 

'defghi-jkImnoparstuvwxyzabcOEFGHIJKIMIOFORSTUUWXYZABC 
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# 创 建 字符 转换 表 , 将 英文 字母 替换 为 该 字母 后 面 第 3 个 字母 
>>> table '' .maketrans (before, after) 
»»»exaple- 'Tf the implementation is easy to explain, it may be a good idea." 
>>> example.translate (table) 
"Là wkh lpschphqwdwlrq lv hdvb wr hasodlq, lw pdb eh d jrrg lghd.' 


(QARAR: Python 标准 库 中 的 string 提供 了 英文 字母 大 小 写 、 数 字 字符 、 标 点 符 
号 等 常量 ,可 以 直接 使 用 ,下 面 的 代码 实现 了 随机 密码 生成 功能 。 


>>> inport string 
»»»x-string.digitst string.ascii letters* string.punctuation 

# 可 能 的 字符 集 
22x 


'0123456789abcdefghi jklmopeestuvwxyzABCDEFGHIJKLMNOFEORSTUWWXYZ I$ $8! () * +,- ./:;<=>?@ [NN]^ 7 
UP" 

>>> import randm 

>>> ''.join([randm.choice(x)for i in range (8)]) # 随 机 选择 8 个 字符 
"EN (CGÉ- )g" 

»»»''.join([randam.choice (x) for i in range (8) ]) 

' (rz [44M 

»»»''.join([randm.choice (x) for i in range (8) ]) 

'o 2 Mir 

»»»''.join([randm.choice (x) for i in range (8) ]) 

"n [IT)5ve " 


改 其 中 的 值 , 只 能 重新 创建 一 个 新 的 字符 串 对 象 。 然 而 ,如 果 确 实 需要 一 个 支持 原 地 修改 
的 unicode 数据 对 象 ,可 以 使 用 io. StringIO 对 象 或 array 模块 。 


> > > fran io import Stringlo 

>>> s= "Hello world" 

>>> sio-StringIO(s) # 创 建 可 变 字符 串 对 象 
>>> sio 

< io.StringIO dbject at 0x000000000309@E8> 

»»»sio.tell() # 返 回 当前 位 置 

0 


>>> sio.read() # 从 当前 位 置 开 始 读 取 字 符 串 
"Hello world' 


»»» sio.getvalue() # 返 回 可 变 字符 串 的 全 部 内 容 
"Hello world' 

»»»sio.tell() 

n 

>>> sio.seek(6) # 重 新 定位 当前 位 置 

6 


>>> sio.write('SDIBP') # 从 当前 位 置 开 始 写 入 字符 串 
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5 
>>>sio.read() # 从 当前 位 置 开 始 读 取 字 符 串 


>>> sio.getvalue() 

"Hello SDIBT" 
»»2»Ssio.tell() 

1l 

>>> s= "Hello world" 

>>> frm array inport array 


»»»sa-array('u', s) # 创 建 可 变 字符 串 对 象 
>>>print (sa) 

array('u', 'Hello world') 

»»»print (sa.tostring()) # 查 看 可 变 字符 串 对 象 的 内 容 
b'H\x00e\x001\x001\ x000\ x00 \x00w\ x000\x00r\ x001 \x00d\ x00" 

>>>print (sa.tounicode()) # 查 看 可 变 字符 串 对 象 的 内 容 
Hello world 

>>> sa[0]- 'F' # 修 改 指定 位 置 上 的 字符 
»»»print(sa) 

array('u', 'Fello world') 

>>> sa.insert (5, 'w') # 在 指定 位 置 插 入 字符 

»»» print (sa) 

array('u', 'Fellow world') 

>>> sa.remove ('17) # 删 除 指定 字符 的 首次 出 现 
>>>print(sa) 


array('u', 'Felow world') 
>>> sa.remove('w') 
>>>print (sa) 


array('u', 'Felo world') 


7. stripO ,rstripO ,IstripO) 
这 几 个 方法 分 别 用 来 删除 两 端 . 右 端 或 左 端 连 续 的 空白 字符 或 指定 字符 。 


»»»s"adc o" 

»»»s2-s.strip() # 删 除 空白 字符 
>>>s2 

"aen 

>>> '\n\mhello world \n\n'.strip() # 删 除 空白 字符 
"hello world" 

>>> "aaaassddf" strip ("a") # 删 除 指定 字符 
"ssddf" 

>>> "aaaassddf".strip ("af") 

"seda" 

>>> "aaaassddfaaa" .rstrip ("a") # 删 除 字符 串 右 端 指定 字符 
'aaaassddf"' 
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>>> "aaaassddfaaa" .1strip ("a") # 删 除 字符 串 左 端 指定 字符 
'ssddfaaa' 


的 两 侧 、 右 侧 、 左 侧 删 除 参数 字符 囊 中 包含 的 所 有 字符 ,例如 : 


>>> 'aatbcoddeeeffg' .strip('af') HFE f 不 在 字符 串 两 侧 , 所 以 不 删除 
"Hbcoddeeeffg' 

>>> 'aatbcoddeeeffg' .strip('gaf') 

"Hocoddeee! 

>>> 'aakbcoddeeeffg' .strip('gaef') 

"Hood! 

>>> 'aabbcoddeeeffg' .strip ('goaef') 

"codd! 

>>> 'aatbcoddeeeffg' .strip ('goaefod!) 


8. evalO 


VÀ EPA C eval() 用 来 把 任意 字符 串 转化 为 Python 表达 式 并 进行 求 值 。 


>>>eval ("3+ 4") # 计 算 表 达 式 的 值 

7 

»2»»8a3 

»»»b-5 

»»»eval('atb!) # 这 时 候 要 求 变 量 a 和 b 已 存在 
8 

>>> inport math 


>>> eval ('help tmath.sqrt) ') 
Help on built- in function sqrt in module math: 
sgte) 
sqt (x) 
Return the square root of x. 
>>> eval ('math.sqrt (3) ') 
1.7320508075688772 
>>>eval('aa') # 当 前 作用 域 中 不 存在 aa, 抛 出 异常 
Traceback (most recent call last): 
File "< pyshell#3> ", line 1, in «module 
eval ('aa') 
File "« string» ", line 1, in «module» 
NameError: name 'aa' is not defined 


在 Python 3.x 中 ,input() 将 用 户 的 输入 一 律 按 字 符 串 对 待 ,如 果 需 要 将 其 还 原 为 本 
来 的 类 型 ,可 以 使 用 内 置 函 数 eval() ,有 时 候 可 能 需要 配合 异常 处 理 结构 。 


»»»x-input() 
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SS 


>>>eval (x) 
357 

»»»x-input() 

[3, 5, 7] 

55>% 

"B, 5, 7]" 

>>>eval (x) # 注 意 ,这 里 不 能 使 用 list (x) 进 行 转换 
[3, 5, 7] 

»»»x-input() 


»»»try: # 当 前 作用 域 中 不 存在 变量 aoc 
print (eval (x) ) 
exoept: 
print (*wrong input') 
wrong input 
您 注意 : 虽然 整体 来 说 Python 是 一 种 非常 安全 的 编程 语言 ,不 像 C 语言 的 strcpy()、 
strcat() 等 库 函 数 那 样 存在 大 量 安全 威胁 ,但 这 并 不 代表 我 们 可 以 随意 编写 Python 程序 
而 不 需要 考虑 任何 安全 性 ,就 像 安全 系数 再 高 的 汽车 在 驾驶 时 也 要 遵守 必要 的 交通 规则 
一 样 。 虽 说 智者 千 虑 必 有 一 失 , 但 是 如 果 我 们 不 “ 虑 ”就 会 写 出 千 郊 百 孔 、 漏 洞 百出 的 程 
序 , 那 时 候 再 想 亡 羊 补 牢 就 太 难 了 。Python 的 内 置 函数 eval() 可 以 计算 任意 合法 表达 式 
的 值 , 如 果 用 户 巧妙 地 构造 输入 的 字符 串 ,可 以 执行 任意 外 部 程序 ,例如 ,下 面 的 代码 运行 
后 可 以 启动 记事 本 程序 ; 
»»»a-input('Please input a value:') 
Please input a value: — import — ('os').startfile(r'C: Windows V Wnotepad.exe' ) 
»»»ewal(a) 
是 不 是 非常 危险 啊 ? 如 果 觉 得 这 没什么 ,再 执行 下 面 的 代码 试 试 : 
»»»eval(" import — ('os').system('md testtest')") 


发 生 了 什么 ? 什么 也 没有 ,只 是 屏幕 闪 了 一 下 ,不 知道 各 位 读者 会 怎么 想 , 我 每 次 看 
到 这 样 的 情况 都 会 心慌 ,因为 我 们 不 知道 到 底 发 生 了 什么 ,多 年 前 有 很 多 恶意 软件 都 是 屏 
幕 一 闪 就 悄悄 地 对 我 们 的 计算 机 做 了 很 多 事情 ,例如 安装 木马 、 窃 取 、 删 除 或 者 破坏 数据 。 
回 到 上 面 的 代码 ,让 我 们 看 看 当前 工作 目录 中 多 了 什么 ( 太 可 怕 了 ,居然 多 了 个 名 字 是 
testtest 的 文件 夹 ) ,当然 可 以 调用 rd 命令 来 删除 这 个 文件 夹 或 其 他 文件 ,或 者 精心 构造 
其 他 字符 串 来 达到 特殊 目的 。 
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因此 ,如 果 我 们 的 程序 中 有 使 用 内 置 函 数 eval() 对 用 户 输入 的 字符 囊 求 值 的 代码 ,一 
定 要 检查 用 户 答 入 的 字符 事 中 是 否 有 让 险 的 字符 事 \ 个 如 ” _import CoD." GNI 


容易 引发 “血案 ”。 不 知道 怎么 检查 ? 请 继续 往 下 看 关键 字 in 的 介绍 。 
9. 关键 字 in 


与 列表 、 元 组 字典、 集合 一 样 , 也 可 以 使 用 关键 字 in 和 not in 来 判断 一 个 字符 串 是 
否 出 现在 另 一 个 字符 串 中 ,返回 True False, 


>>> "a" in "abode" # 测 试 一 个 字符 串 是 否 存在 于 另 一 个 字符 串 中 

True 

>>> "ab' in 'abode" 

True 

>>> 'ac' in 'abode' # 关 键 字 in 左边 的 字符 串 作 为 一 个 整体 对 待 

False 

>>>"" in "abode" 

False 

几乎 所 有 论坛 或 社区 都 会 对 用 户 提交 的 输入 进行 检查 ,并 过 滤 一 些 非法 的 敏感 词 ,这 
极 大 地 促进 了 网 络 文明 和 净化 。 这 样 的 功能 实际 上 就 可 以 使 用 关键 字 in 来 实现 ,例如 ， 
下 面 的 代码 用 来 检测 用 户 输 入 中 是 否 有 不 允许 的 敏感 字 词 ,如 果 有 就 提示 非法 ,否则 提示 
正常 。 

>>>words = (Mit, ER, EI 

>>> text= input (' 请 输入 :') 

请 输入 :这 句 话 里 含有 非法 内 容 


>>> for word in words: 
if word in text: 


print(' 非 法 ') 
break 
else: 
print(' 正 常 ') 
下 面 的 代码 则 可 以 用 来 测试 用 户 输入 中 是 否 有 敏感 词 ,如 果 有 就 把 敏感 词 蔡 换 为 3 
个 星 号 xxx。 


>>>words = ("测试 ',' 非 法 '，' 暴 力 ', ' 话 ') 
»»»text- ' 这 句 话 里 含有 非法 内 容 ' 
>>> for word in words: 
if word in text: 
text= text.replace (word, "e**') 
>>> text 


,这 句 xxx 里 含有 xxx 内 容 ， 


10. startswith() ,endswith() 


这 两 个 方法 用 来 判断 字符 串 是 否 以 指定 字符 串 开 始 或 结束 ,可 以 接收 两 个 整数 参数 
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来 限定 字符 串 的 检测 范围 ,例如 : 


>>> s 'Beautiful is better than ugly.' 
»»» s.startswith ('Be') # 检 测 整个 字符 串 

True 

»»»s.startswith('Be', 5) # 指 定 检测 范围 的 起 始 位 置 

False 

»»»s.startswith('Be', 0, 5) # 指 定 检测 范围 的 起 始 和 结束 位 置 
Tre 
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面 的 代码 可 以 列 出 指定 文件 夹 下 所 有 扩展 名 为 bmp pg 或 gif 的 图 片 。 


>>> import os 
>>> [filename for filename in os.listdir(r'D:\\')if filename.endswith(('.bmp', '.jpg', '.gif'))] 


11. isalnum C) , isalpha C) , isdigit ( ) , isdecimal ( ) , isnumeric ( ) , isspace  ) , isupper (n , 
islower ) 


用 来 测试 字符 串 是 否 为 数字 或 字母 .是 否 为 字母 .是否 为 数字 字符 .是 否 为 空白 字符 、 
是 否 为 大 写字 母 以 及 是 否 为 小 写字 母 。 


>>> '1234abod' .isalnum() 

True 

>>> '1234abod' .isalpha () # 全 部 为 英文 字母 时 返回 True 
False 

>>> '1234abod' .isdigit () # 全 部 为 数字 时 返回 True 
False 

>>> 'abod' .isalpha() 

True 

>>> '1234.0' .isdigit() 

False 

>>> '1234' .isdigit () 

True 

>>> ' 九 '.isnumeric() #isnumeric() 方 法 支持 汉字 数字 
True 

>>> ' 九 '.isdigit() 

False 

>>> UL'.isdecimal() 

False 

>>> 'N I X '.isdæcima1 () 

False 

>>> 'N I X '.isdigit( 

False 


>>> 'N I X *.isnmerico # 支 持 罗马 数字 
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True 


(QARAR: Python 标准 库 unicodedata 提供 了 不 同形 式 数 字 字符 到 十 进 制 数字 
的 转换 方法 。 

>>> import unicodedata 

>>> wicodedata.numeric('2') 

2.0 

>>>unicodedata.numeric(' 九 ') # 汉 字数 字 

9.0 

»»»unicodedata.numeric(' X ") # 罗 马 数字 

10.0 


12. center() ljust() rjust() ,zfill() 
center() ,ljustO ,rjust() 返 回 指定 宽度 的 新 字符 串 , 原 字符 串 居中 、 左 对 齐 或 右 对 齐 


出 现在 新 字符 串 中 ,如 果 指 定 的 宽度 大 于 字符 串 长 度 , 则 使 用 指定 的 字符 进行 填充 ,默认 
以 空格 进行 填充 。zfill() 返 回 指定 宽度 的 字符 串 ,在 左 侧 以 字符 0 进行 填充 。 


>>> 'Hello world!'.center (20) # 居 中 对 齐 ,以 空格 进行 填充 

' Helloworld! — ' 

>>> 'Hello world!'.center(20, '- ') # 居 中 对 齐 , 以 字符 "= "进行 填充 
'==== Hello world! 

>>> 'Hello world! '.ljust (20, '=') # 左 对 齐 

"Hello world!==== 

>>> 'Hello world!'.rjust(20, '=') # 右 对 齐 

'========Hello world!' 

>>> 'abc'.zfill(5) # 在 左 侧 填 充 数字 字符 0 
100abe! 

>>> 'abc'.zfill(2) # 指 定 宽度 小 于 字符 串 长 度 时 ,返回 字符 串 本 身 
"abe" 

>>> 'uio'.zfill(20) 

*00000000000000000110* 


(以 拓展 知识 : Python 标准 库 textwrap 提供 了 更 加 友好 的 排版 函数 。 例 如 ， 


> > > import textwrap 
>>> dbc= ''' "Beautiful is better than ugly. 
Explicit is better than implicit. 

Simple is better than camplex. 

Flat is better than nested. 

Sparse is better than dense. 

Feadability counts. 

Special cases aren't special enough to break the rules. 
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Although practicality beats purity. ''' 

>>>print (textwrap.fill (doc, width= 20) ) # 按 指定 宽度 进行 排版 
"Beautiful is better 

than ugly. Explicit 

is better than 

implicit. Simple is 

better than camplex. 

Camplex is better 

than complicated. 

Flat is better than 

nested. Sparse is 

better than dense. 

Readability counts. 

Special cases aren't 

Special enough to 

break the rules. 

Although 

practicality beats 

parity. 

>>> print (textwrap.fill(doc, width= 80) # 按 指定 宽度 进行 排版 
"Beautiful is better than ugly. Explicit is better than implicit. Simple is 

better than camplex. Complex is better than omplicated. Flat is better than 

nested. Sparse is better than dense. Readability counts. Special cases aren't 

special enough to break the rules. Although practicality beats purity. 

>>> inport porint 

>>>pprint.pprint (textwrap.wrap (doc) ) # 默 认 长 度 最 大 为 70 
["'Beautiful is better than ugly. Explicit is better than implicit.", 
'Simple is better than camplex. Camplex is better than oamplicated.', 
"Flat is better than nested. Sparse is better than dense. Readability', 
"counts. Special cases aren't special enough to break the rules.", 
"Although practicality beats parity.'] 


13. 内 置 函 数 、 切 片 


除了 字符 串 对 象 提 供 的 方法 以 外 ,很 多 Python 内 苞 函 数 也 可 以 对 字符 串 进行 操作 ， 
例如 : 


»»»x-'Hello world." 
>>> len(x) # 字 符 串 长 度 
12 


»»»max(x) # 最 大 字符 


"wi 


»»»min(x) 
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s 
»»»list(zip(x)) #zip() 也 可 以 作用 于 字符 串 
La hte any CL Tv Ty Co Oe jo oN (re "ej" 
a le (6.5, | 
切片 也 适用 于 字符 串 ,但 仅 限于 读 取 其 中 的 元 素 ,不 支持 字符 串 修改 。 
>>> 'Explicit is better than implicit.'[:8] 
"Explicit" 
>>> Explicit is better than implicit.' [9:23] 
"is better than' 
A ae SERE MURIS ”也 支持 字符 串 之 间或 者 字符 串 与 整数 的 运算 ,第 1 章 已 有 介 
绍 ,不 再 著述 。 
513 案例 精 选 


例 5-1 编写 函数 实现 字符 串 加 密 和 解密 ,循环 使 用 指定 密 钥 ,采用 简单 的 异 或 


def crypt (source, key): 
fram itertools import cycle 
result- '' 
tenp- cycle (key) 
for ch in source: 
result- result* chr (ord (ch) ^ ord (next (temp) ) ) 
return result 


Source- 'Shandong Institute of Business and Technology" 
key- 'Dong Fuguo' 


print ('Before Encrypted: '+ source) 
encrypted- crypt (source, key) 

print ('After Encrypted: encrypted) 
decrypted- crypt (encrypted, key) 
print ('After Decrypted: '+ decrypted) 


输出 结果 如 图 5-2 所 示 。 


Before Encrypted: Shandong Institute of Business and Technology | 
After Encrypted:] eğ D)- Uks-PT3 4U "0,]S/-,-a t JH 
After Decrypted: Shandong retitute of Naia a] Technology 


图 5-2 字符 串 加 密 与 解密 结果 


例 5-2 编写 程序 ,生成 大 量 随机 信息 。 
本 例 代码 演示 了 如 何 使 用 Python 标准 库 random 来 生成 随机 数据 ,这 在 需要 获取 大 


量 数 据 来 测试 或 演示 软件 功能 的 时 候 非 常 有 用 ,不 仅 能 真实 展示 软件 功能 或 算法 ,还 可 以 
避免 泄露 真实 数据 或 者 引起 不 必要 的 争议 。 
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import randam 
inport string 
import codecs 


# 常 用 汉字 Unicode ABR 部 分 ), 完 整 列表 详 见 配 套 源 代码 
StringBase- '\u7684\u4e00\u4e86\u662f\u6211\u4e0dN\u5728\u4sba' 
# 转 换 为 汉字 

StringBase- '' .join (StringBase.split (\\u')) 


def getEmail(): 
# 常 见 域名 后 级 ,可 以 随意 扩展 该 列表 
suffix- ['.omm', '.org', '.net', '.cn'] 
characters- string.ascii letters string.digitst ' ' 
username- '' .join ( (randam.choice (characters) for i in range (randcm. randint (6,12) )) ) 
damain- ''.join((randam.choice (characters)for i in range (randam.randint (3,6) ) )) 
return usernamet '@ '+ domaint randam.choioce (suffix) 


def getTelNo () : 
return ''.join((str(randam.randint (0,9) for i in range (11))) 


def getNemeOrAciress (flag) : 
"'"'flag=1 表 示 返 回 随机 姓名 ,flag=0 表 示 返 回 随机 地 址 '"' 
result- '' 
if flag--1: 
# 大 部 分 中 国人 姓名 为 2~ 4 个 汉字 
rangestart, rangeend- 2, 5 
elif flag-- 0: 
# 假 设 地 址 在 10~ 30 个 汉字 之 间 
rangestart, rangeend- 10, 3l 
else: 
print('flag mist be 1 or 0") 
retum '' 
for i in range(rangestart, rangeend): 
result += randam.choice (StringBase) 
return result 


def getSex(): 
return randm.choice(('S8 ', "x ")) 


def tae): 
return str (randcm.randint (18, 100) ) 


df main (filename): 
with codecs.open(filename, 'w', ‘utf- 8')as fp: 
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fp.write ('Name, Sex, Age, Te]ND, Address, Frail\n') 
# 随 机 生成 200 个 人 的 信息 
for i in range(200): 
name= getNameOrzctiress (1) 
Sex— tsex () 
age- gethge () 
tel- getTelNo () 
address getNameOrAcdress (0) 
email- getEmail() 
line ','.join([name, sex, age, tel, address, email])t '\n' 
fp.write (line) 


def output (filename): 
with codecs.cpen (filename, 'r', 'utf- 8')as fp: 
while True: 
line fp.readline () 
if not line: 
retum 
line line.split(',') 
for i in line: 


filename- 'information.txt' 
main (filename) 
output (filename) 


QARAR: Python 扩展 库 jieba 和 snownlp 很 好 地 支持 了 中 文 分 词 ,可 以 使 用 
pip 命令 进行 安装 。 在 自然 语言 处 理 领域 经 常 需要 对 文字 进行 分 词 , 分 词 的 准确 度 直接 
影响 了 后 续 文本 处 理 和 挖 所 算法 的 最 终 效果 。 


>> > import jieba # 导 和 jisba 模 块 

»»»x- ' 分 词 的 准确 度 直接 影响 了 后 续 文 本 处 理 和 挖掘 算法 的 最 终 效果 。 | 
>>>jisba.cut (x) # 使 用 默认 词 库 进行 分 词 
< generator cbject Tokenizer.cut at Qx000000000342C990> 

»»»1list( ) 

Uri, "Bir, ERE, "EURO, ERU, ' 了 ', Un RU, 文本 处 理 "，' 和 "挖掘 … 
TE, ! 的 ', RR, EUR L2 1 

>>> list (jieba.cut ("纸杯 ')) 

[纸杯 "] 

>>> list (jicbe.cut (' 花 纸杯 ')) 

UAE, 纸杯 了 

>>>jisba.ada word(' 花 纸杯 ') # 增 加 词 条 


第 5 章 字符 串 与 正则 表达 式 å 189 
e 


>>> list Ojisba.aut(' 花 纸杯 ')) # 使 用 新 题库 进行 分 词 
[' 花 纸杯 '] 
>>> import snownlp 导入 snomlp 模 块 


>> > snownlp.SnowNLP(' 学 而 时 习 之 ,不 亦 说 乎 ') .words 

[学 而 ',' 时 习 ', "之 … tst, RR, AF 

>> > snownlp.SnowNLP (x) .words 

Ural, "的 "，"' 准 确 度 "'，' 直 接 '，" 影 响 ， Ty "后续 文本 ', e, ' 和 ', ' 挖 气 '， 

EA, Hir, Hen, HORS. ] 

(QARAR: Python 扩展 库 pypinyin 支持 汉字 到 拼音 的 转换 ,并 且 可 以 和 分 词 扩 
展 库 配 合 使 用 。 


>>> fran pypinyin import lazy pinyin, pinyin 


>>> lazy pinyin(" fs] E ') # 返 回 拼音 
'dong', *fu', 'guo"] 
>>> lazy pinyin(' 董 付 国 ', 1) # 带 声调 的 拼音 
'ding', 'fü', 'gi'] 
>>> lazy pinyin(' 董 付 国 ', 2) # 另 一 种 拼音 风格 
‘dong', ‘fu4', 'guo2'] 
>>> lazy pinyin(" fT [8 ', 3) # 只 返回 拼音 首 字 母 
an "Eh Ig] 
>>> lazy pinyin (EE *, 1) # 能 够 根据 词组 智能 识别 多 音字 
'zbpng'， 'yào'] 
>>> lazy pinyin("IE f *, 1) 
'chóng', 'yáng'] 
>>>pinyin(' 重 阳 ') # 返 回 拼音 
['dhóng*], ['yáng']] 
»»»pinyin(' [H 15 ', neteronym- True) # 返 回 多 音字 的 所 有 读音 
['zbóng', 'chóng', 'tóng'], ['yáng'], ['jié', 'jie']] 
>>> import jieba # 其 实 不 需要 导入 jisba, 这 里 只 是 说 明 已 安装 
»»»x- "中 英文 混合 test123' 
>>> lazy pinyin(x) # 自 动 调用 已 安装 的 jieba 扩 展 库 分 词 功能 


['zhong", 'ying', "wen', "hun', "he', 'test123'] 

>>> lazy pinyin (jieba.cut (x)) 

['zhong", 'ying', "wen', "hun', he', 'test123'] 

>>> 交 山东 烟台 的 大 樱桃 真 好 吃 啊 ' 

>>> sated, key- lambda ch: lazy pinyin(ch)) # 按 拼音 对 汉字 进行 排序 
TE, ES, UA, 的， y Een En Men HB ES UH 


5.2 正则 表达 式 


正则 表达 式 是 字符 串 处 理 的 有 力 工具 和 技术 ,正则 表达 式 使 用 预定 义 的 特定 模式 去 
匹配 一 类 具有 共同 特征 的 字符 串 ,主要 用 于 字符 串 处 理 ,可 以 快速 准确 地 完成 复杂 的 查 
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s 


找 、 蔡 换 等 处 理 要 求 。 
521 正则 表达 式 语法 与 子 模式 扩展 语法 


正则 表达 式 由 元 字符 及 其 不 同 组 合 来 构成 ,通过 巧妙 地 构造 正则 表达 式 可 以 匹配 任 
意 字 符 串 ,并 完成 复杂 的 字符 串 处 理 任务 。 常 用 的 正则 表达 式 元 字符 如 表 5-3 所 示 。 


表 5-3 常用 的 正则 表达 式 元 字符 


元 字符 


功能 说 明 


匹配 除 换行 符 以 外 的 任意 单个 字符 


匹配 位 于 “* "之 前 的 字符 或 子 模式 的 0 次 或 多 次 出 现 


匹配 位 于 “十 "之 前 的 字符 或 子 模式 的 1 次 或 多 次 出 现 


用 在 [] 之 内 用 来 表示 范围 


匹配 位 于 “| ”之 前 或 之 后 的 字符 


匹配 行 首 , 匹 配 以 “后 面 的 字符 开头 的 字符 串 


匹配 行 尾 ,匹配 以 $ 之 前 的 字符 结束 的 字符 串 


匹配 位 于 “?” 之 前 的 0 个 或 1 个 字符 。 当 此 字符 紧 随 任何 其 他 限定 符 (* 、 十 ,?、{n}、 
{n,)、{n,m)) 之 后 时 ,匹配 模式 是 “ 非 贪 心 的 "。“ 非 贪心 的 "模式 匹配 搜索 到 的 、 尽 可 能 短 
的 字符 串 , 而 默认 的 “贪心 的 ”模式 匹配 搜索 到 的 、 尽 可 能 长 的 字符 串 。 例 如 ,在 字符 串 
"oooo" 中 ,"o 十 ?" 只 匹配 单个 o, 而 "o 十 "匹配 所 有 o 


表示 位 于 \ 之 后 的 为 转 义 字符 


此 处 的 num 是 一 个 正 整数 。 例 如 ,“(. )\1” 匹 配 两 个 连续 的 相同 字符 


换 页 符 匹配 


换行 符 匹配 


匹配 一 个 回 车 符 


匹配 单词 头 或 单词 尾 


与 \b 含义 相反 


匹配 任何 数字 ,相当 于 [0-9] 


与 \d 含义 相反 ,等 效 于 ["0-9] 


匹配 任何 空白 字符 ,包括 空格 、 制 表 符 、 换 页 符 ,与 [ \f\n\r\t\v] 等 效 
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续 表 

元 字符 功能 说 明 
AS 与 \s 含义 相反 
\w 匹配 任何 字母 .数字 以 及 下 夯 线 ,相当 于 [a-zA-Z0-9_] 
Nw 与 \w 含义 相反 ,与 [*A-Za-z0-9_] 等 效 
O 将 位 于 () 内 的 内 容 作为 一 个 整体 来 对 待 
0 按 {} 中 的 次 数 进行 匹配 
口 匹配 位 于 口中 的 任意 一 个 字符 
xyz] |“ 放 在 [] 内 表示 反 向 字符 集 ,匹配 除 xyz 之 外 的 任何 字符 
[a-z] 字符 范围 ,匹配 指定 范围 内 的 任何 字符 
C'az] | 反 向 范围 字符 ,匹配 除 小 写 英文 字母 之 外 的 任何 字符 

如 果 以 “\” 开 头 的 元 字符 与 转 义 字符 相同 , 则 需要 使 用 “\\”, 或 者 使 用 原始 字符 串 。 


在 字符 串 前 加 上 字符 + 或 R 之 后 表示 原始 字符 串 ,字符 串 中 任意 字符 都 不 再 进行 转 义 。 
原始 字符 串 可 以 减少 用 户 的 输入 ,主要 用 于 正则 表达 式 和 文件 路 径 字 符 串 的 情况 ,但 如 果 


字符 串 以 一 
具体 应 


个 斜 线 “\” 结 束 , 则 需要 多 写 一 个 斜 线 , 即 以 “\\” 结 束 。 
用 时 ,可 以 单独 使 用 某 种 类 型 的 元 字符 ,但 处 理 复杂 字符 串 时 ,经 常 需 要 将 多 


个 正则 表达 式 元 字符 进行 组 合 , 下 面 给 出 几 个 简单 的 示例 。 

CD 最 简单 的 正则 表达 式 是 普通 字符 串 , 只 能 匹配 自身 。 

(2) fpjc]jython 可 以 匹配 python'iython'、cython'。 

(3) [a-zA-20-9] 可 以 匹配 一 个 任意 大 小 写字 母 或 数字 。 

(4) [^abcj] 可 以 一 个 匹配 任意 除 a"\'b'\c 之 外 的 字符 。 

(5) python| perl 或 bp(ython|erl) 都 可 以 匹配 python 或 perl'。 

(6) 子 模 式 后 面 加 上 问号 表示 可 选 。r(http://)? (wwwN. )? python\. org' 只 能 匹 
ehttp://www. python. org','http://python. org'、 www. python. org' 和 'python. org'。 

(7) ^http' 只 能 匹配 所 有 以 http 开 头 的 字符 串 。 

(8) (pattern) * : 允许 模式 重复 0 次 或 多 次 。 

(9) (pattern) 十 : 允许 模式 重复 1 次 或 多 次 。 


(10) 
(11) 
(12) 
3) 


(pattern) (m, n) : 允许 模式 重复 m~n K. 

indie 匹配 多 个 (包含 0 个 )a 或 b, 后 面 紧 跟 一 个 字母 c。 

ab{1,)': 等 价 于 ab 十 ,匹配 以 字母 a 开头 后 面 带 1 个 或 多 个 字母 b 的 字符 串 。 
W Z]{1}([a-zA-Z0-9._]){14,19} $': 匹配 长 度 为 5 一 20 的 字符 串 ,必须 以 


字母 开头 、 可 带 数 字 、“_”、“. ”的 字符 串 。 


(14) “Aw ( 6,20) $* : 匹配 长 度 为 6 一 20 的 字符 串 ,可 以 包含 字母 ,数字 、 下 面 线 。 

(15) "\d{1,3}\. \d{1,3}\. \d{1,3}\. \d{1,3} $: 检查 给 定 字 符 串 是 否 为 合法 IP 
地 址 。 

a6) ^(13[4-9]\d{t8))1(15[01289]\d{8)}) $': 检查 给 定 字 符 串 是 否 为 移动 手机 
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号 码 。 
(UD ^[a-zA-Z] 十 $': 检查 给 定 字符 串 是 否 只 包含 英文 字母 大 小 写 。 

(18) 入 w 十 @(\w 十 \. ) 十 \w 十 $': 检查 给 定 字符 串 是 否 为 合法 电子 邮件 地 址 。 
(19) “AD? \d 十 (\.\d{1,2))? $: 检查 给 定 字符 串 是 否 为 最 多 带 有 2 位 小 数 的 
正 数 或 负数 。 

(20) [\u4e00-\u9fa5]': 匹配 给 定 字符 串 中 的 所 有 汉字 。 

(21) "\d{18) |\d{15}) $: 检查 给 定 字 符 串 是 否 为 合法 身份 证 格式 。 

(22) Adi 4)Ad(1.2)-Ad(1.2)*; 匹配 指定 格式 的 日 期 ,例如 2016-1-31。 

(23) ^(? =. * [a-z])(? =. * [A-Z])(? =. * \d)(? =. *[,._]). {8} $': 检查 
给 定 字 符 串 是 否 为 强 密码 ,必须 同时 包含 英文 大 写字 母 .英文 小 写字 母 ,数字 或 特殊 符号 
(如 英文 逗号 、 英 文句 号 、 下 夯 线 ) ,并 且 长 度 必须 至 少 8 位 。 

(24) "CH. x [AAV —26? D. E". 如 果 给 定 字符 串 中 包含 \”、/、;、 二 、%、? 则 匹 
配 失败 ,关于 子 模式 语法 请 参考 表 5-4。 

(25) CONME: 匹配 任意 字符 的 一 次 或 多 次 重复 出 现 。 

(26) ((? P-—fNbNw--M)Ns-(O. P=f))'; 匹配 连续 出 现 两 次 的 单词 。 

您 注意 : 正则 表达 式 只 是 进行 形式 上 的 检查 ,并 不 保证 内 容 一 定 正确 。 例 如 ,上 面 
的 例子 中 ,正则 表达 式 仆 d{1,3)\.\d{1,3}\. \d{1,3)\. \d{1,3) 名 ' 可 以 检查 字符 囊 是 否 
为 IP 地 址 ,字符 串 '888. 888. 888. 888' 这 样 的 也 能 通过 检查 ,但 实际 上 并 不 是 合法 的 TP 
地 址 。 

正则 表达 式 使 用 圆 括号 ”()” 表 示 一 个 子 模 式 , 圆 括号 内 的 内 容 作为 一 个 整体 出 现 , 例 
如 ,“(red) 十 ”可 以 匹配 redred,redredred 等 多 个 重复 red 的 情况 。 使 用 子 模式 扩展 语法 
可 以 实现 更 加 复杂 的 字符 串 处 理 , 常 用 的 扩展 语法 如 表 5-4 所 示 。 


表 5-4 常用 子 模式 扩展 语法 


语 法 功能 说 明 


(? P<groupnameœ>) 


为 子 模式 命名 


(? iLmsux) 


设置 匹配 标志 ,可 以 是 几 个 字母 的 组 合 , 每 个 字母 含义 与 编译 标志 相同 


(2,08 


匹配 但 不 捕获 该 匹配 的 子 表达 式 


(? P—groupname) 


表示 在 此 之 前 的 命名 为 groupname 的 子 模式 


(6 $e) 表示 注释 

(reu 用 于 正则 表达 式 之 后 ,表示 如 果 “==” 后 的 内 容 在 字符 串 中 出 现 则 匹配 ,但 
不 返回 “二 "之 后 的 内 容 

aum) 用 于 正则 表达 式 之 后 ,表示 如 果 “!" 后 的 内 容 在 字符 串 中 不 出 现 则 匹配 ,但 
i 不 返回 “!" 之 后 的 内 容 

(ge 用 于 正则 表达 式 之 前 ,与 (? 一 …) 含 义 相同 

AES o] 用 于 正则 表达 式 之 前 ,与 (?! …) 含 义 相同 


的 小 提示 : 正则 表达 式 语法 实在 是 太 多 了 ,很 难 全 部 记 住 (有 读者 说 : Python 语法 
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也 很 多 的 ,也 很 难 记 啊 )。 我 个 人 的 建议 是 ,学 会 学 习 和 学 会 思考 比 学 会 知识 更 加 重要 ,大 
家 要 做 个 “知道 分 子 ”, 遇 到 问题 之 后 要 知道 解决 问题 的 大 致 思路 和 方向 ,具体 的 细节 ( 比 
如 函数 用 法 和 参数 含义 ) 可 以 通过 搜索 或 查看 帮助 文档 来 解决 ,不 需要 (也 不 可 能 ) 把 一 切 
都 记 到 脑子 里 。 善 于 搜索 能 让 我 们 更 快 地 解决 问题 ,站 在 巨人 的 肩膀 上 才能 事半功倍 。 
当然 ,必要 的 基础 知识 还 是 要 掌握 和 熟悉 的 ,不 然 很 难 判断 搜索 到 的 内 容 是 否 正确 ,毕竟 


网 上 的 资料 实在 是 太 杂 乱 了 。 
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Python 标准 库 re 提供 了 正则 表达 式 操作 所 需要 的 功能 , 既 可 以 直接 使 用 re 模块 中 
的 方法 ( 见 表 5-5) 来 实现 字符 串 处 理 , 也 可 以 把 模式 编译 成 正则 表达 式 对 象 再 使 用 。 


方 ” 法 


表 5-5 re 模块 常用 方法 
功能 说 明 


compile(pattern[, flags]) 


创建 模式 对 象 


search(pattern, string[, flags]) 


在 整个 字符 串 中 寻找 模式 ,返回 match 对 象 或 None. 


match(pattern, string[, flags]) 


从 字符 串 的 开始 处 匹配 模式 ,返回 match 对 象 或 None 


findall(pattern, string[, flags]) 


列 出 字符 串 中 模式 的 所 有 匹配 项 


split(pattern, string[ » maxsplit=0]) 


根据 模式 匹配 项 分 割 字符 串 


sub(pat, repl, string[, count=0]) 


将 字符 串 中 所 有 pat 的 匹配 项 用 repl 替换 


escape(string) 


将 字符 串 中 所 有 特殊 正则 表达 式 字符 转 义 


其 中 ,函数 参数 flags 的 值 可 以 是 re. I( 注 意 是 大 写字 母 TI, 不 是 数字 1, 表 示 忽 略 大 小 
T) .re.L( 支 持 本 地 字符 集 的 字符 ) ,re. M( 多 行 匹 配 模式 ) 、re. S( 使 元 字符 “. ”匹配 任意 
字符 ,包括 换行 符 ) re. U( 匹 配 Unicode 字符 )、re. X( 忽 略 模式 中 的 空格 ,并 可 以 使 用 # 
注释 ) 的 不 同 组 合 ( 使 用 “| 进行 组 合 ) 。 


1. 直接 使 用 re 模块 中 的 方法 


>> > import re # 导 入 re 模块 
»»»text- 'alrha. beta .. gama delta" # 测 试用 的 字符 串 

»»»re.split('[N. ]+ ', text) # 使 用 指定 字符 作为 分 隔 符 进行 分 隔 
['alpha', 'beta', 'gamma', 'delta'] 

»»»re.split('[N. ]* ', text, maxsplit-2) # 最 多 分 隔 2 次 

['alpha', ‘beta', 'gamma delta'] 

>>>re.split('[\. ]+', text, maxsplit-1) # 最 多 分 隔 1 次 

['alpha', "beta .. gama delta'] 

>>>pat= '[a- zA- Z]+ " 

>>> re.findall (pat, text) # 查 找 所 有 单词 


['alpha', 'beta', 'gamma', 'delta'] 
22»»pat- '(name]" 
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>>> text= 'Dear [name]: " 
»»»re.sub(pat, 'Mr.Dong', text) # 字 符 串 替换 
"Dear Mr.Dong… ' 


»»»s-'asd' 


»»»re.sub('a|s|d', 'good', s) # 字 符 串 替换 

'good good good* 

>>> re.escape ('http: //www.python.org') EET BE X 

"http\ NN AN /wesiN \ -python\\ .org* 

»»» print (re.match ('done|quit', 'done')) # 匹 配 成 功 , 返 回 match 对 象 
< sre.SRE Match dbject at 0x00B121A8> 

»»» print (re.match ('Ódone| quit', 'done!")) # 匹 配 成 功 

< sre.SRE Match cbject at 0x00B121A8> 

>>>print (re.match ('done| quit', 'doe!')) # 匹 配 不 成 功 ,返回 空 值 None 
None 

>>>print (re.match ('done| quit', 'd!one! ')) # 匹 配 不 成 功 

None 

»»» print (re.match('done|quit', 'dlone!done')) # 匹 配 不 成 功 

None 

»»» print (re.search ('done| quit', 'd'one!done")) # 匹 配 成 功 


< sre.SRE Match dbject at Qx0000000002D03D98> 


下 面 的 代码 使 用 不 同 的 方法 删除 字符 串 中 多 余 的 空格 ,如 果 遇 到 连续 多 个 空格 则 只 
保留 一 个 ,同时 删除 字符 串 两 侧 的 所 有 空白 字符 。 


>>> inport re 

>>> s "aaa bb cde fff ? 

»»»' '.join(s.split ()) # 不 使 用 正则 表达 式 ,直接 使 用 字符 串 对 象 的 方法 
"aaa bb c de fff' 

»»»re.split('[Ns]* ', s) 

['ana', "tb', 'c", 'd', 'e", '£££*, ''] 

»»»re.split('[Ve]* ', s.strip0) # 同 时 使 用 ze BER KD IEM EA UE 7 A 
['ana', "tb', 'c 'd', 'e', '£££'] 

»»2»' '.join(re.split (' [Ns]* ', s.strip())) 

"aaa kb c de fff' 

>>>' 'join(re.split('Vs* ', s.strip())) 

'aca Hb c d e fff' 

>>>re.sb('\s+', ' ', s.strip()) # 直 接 使 用 ze 模块 的 字符 串 替换 方法 


"aaa bb c d e fff" 


下 面 的 代码 使 用 以 “\” 开 头 的 元 字符 来 实现 字符 串 的 特定 搜索 。 


>>> import re 

> > > example= 'ShanDong Institute of Business and Technology is a very beautiful school." 
»»»re.findall ('\\ba.+?\\b', example) HIF a JE B9 53 9c ji] Lo rd lE DEA 
aaa ay 


>>> re.findall ("\\ba.+ \\b', example) # 贪 心 模式 的 匹配 结果 
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['and Technology is a very beautiful school'] 
>>> re.findall ('\\ba\w* \\b', example) 


[rand', 'a'] 
>>> re.findall ('\\Bo.+ ?\\b', exemple) # 不 以 o 开 头 且 含有 o 字 母 的 单词 剩余 部 分 
['ong', 'ology', 'ool'] 

>>> re.findall ('\\b\w.+ ?\\b', example) # 所 有 单词 


可 

>>> re.findall ('\wt ', example) # 所 有 单词 

5j 

>>> re.findall (r'\b\w.+ ? \b', exemple) # 使 用 原始 字符 串 


>>> re.split('\s', example) # 使 用 任何 空白 字符 分 隔 字符 串 
['ShanDong', "Institute', 'of', 'Business', 'and', 'Technology', 'is', 'a', 'very', 'beautiful', ' 
school.'] 


»»»re.findall('Ndt \.\dt \.\dt ', "Python 2.7.11") 
# 查 找 并 返回 x.x.x 形 式 的 数字 
['2.7.11'] 
»»»re.findall('Adt \.\dt \.\dt ', "Python 2.7.11, Python 3.5.1') 
['2.7.11', '3.5.1'] 


2. 使 用 正则 表达 式 对 象 


首先 使 用 re 模块 的 compile() 方 法 将 正则 表达 式 编 译 生成 正则 表达 式 对 象 ,然后 再 
使 用 正则 表达 式 对 象 提供 的 方法 进行 字符 串 处 理 。 使 用 编译 后 的 正则 表达 式 对 象 不 仅 可 
以 提高 字符 串 处 理 速 度 , 还 提供 了 更 加 强大 的 字符 串 处 理 功 能 。 

正则 表达 式 对 象 的 match(string[，pos[，endpos]]) 方 法 用 于 在 字符 串 开 头 或 指定 
位 置 进行 搜索 ,模式 必须 出 现在 字符 串 开头 或 指定 位 置 ; search (string[，pos 
[，endposj]]) 方 法 用 于 在 整个 字符 串 或 指定 范围 中 进行 搜索 ;findall (string[，pos 
[，endpos]]) 方 法 用 于 在 字符 串 中 查找 所 有 符合 正则 表达 式 的 字符 串 并 以 列表 形式 
返回 。 

>>> inport re 

>>> exanple= 'ShanDong Institute of Business and Technology' 

2» pattem- re.oamile (r'\bB\w+ \b') # 编 译 正则 表达 式 对 象 ,查找 以 B 开 头 的 单词 


»»»pattern.findall (example) # 使 用 正则 表达 式 对 象 的 finau (方法 
['Business'] 

»»»pattern- re.oampile (r' Ww g Vb!) # 查 找 以 字母 g 结 尾 的 单词 
»»»pattern.findall (example) 

['ShanDong'] 


»»»pattem-re.ompile(r'Vo[a-za- 2] 3) Vo*). ER 3 个 字母 长 的 单词 
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»»»pattern.findall (example) 

['and'] 

»»»pattern.match (example) 
»»»pattern.search (example) 

< sre.SRE Match cbject at Qx012288C8» 
>>>patter re.oampile (r'NbNw* aNw* Vb!) 
»»»pattern.findall (example) 

['ShanDong', 'and'] 


# 从 字符 串 开头 开始 匹配 ,失败 返回 空 值 
# 在 整个 字符 串 中 搜索 成功 


# 查 找 所 有 含有 字母 a 的 单词 


>>> text- "He was carefully disguised but captured quickly by police." 


>>> re.findall (r"Nw* ly", text) 
['carefully', 'quickly'] 


正则 表达 式 对 象 的 sub Crepl. string[. count —0 D fI subn(repl. string[. count = 


0]) 方 法 用 来 实现 字符 串 蔡 换 功 能 。 


»»»examle- '''Beautiful is better than ugly. 


Explicit is better than implicit. 
Simple is better than oamplex. 

Camplex is better than complicated 
Flat is better than nested. 

Sparse is better than dense. 
Readability counts. ''' 

>>> patterns re.ompile(r'\Hb\w* \b', re.I) 
>>>pattem.sub('* ', exanple) 

* is * than ugly. 

Explicit is * than implicit. 

Simple is * than camplex. 

Complex is * than oamplicated. 
Flatis * than nested. 

Sparse is * than dense. 

Readability counts. 
»»»pattern.sub('* ', example, 1) 

* is better than ugly. 

Explicit is better than implicit. 
Simple is better than camplex. 
Complex is better than camplicated. 
Flat is better than nested. 

Sparse is better than dense. 
Readability counts. 

>>>Ppattern re.campile (r'AXEbNw * Vo") 
»»»pattern.sub(' * ', example, 1) 
Beautiful is * than ugly. 

Explicit is better than implicit. 
Simple is better than camplex. 

Complex is better than oamplicated. 


# 查 找 所 有 以 字母 组 合 ly 结尾 的 单词 


# 正 则 表达 式 对 象 ,匹配 以 b 或 B 开 头 的 单词 
# 将 符合 条 件 的 单词 替换 为 * 


# 只 替换 1 次 


# 匹 配 以 字母 b 开 头 的 单词 
# 将 符合 条 件 的 单词 替换 为 * ,只 替换 1 次 
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Flat is better than nested. 
Sparse is better than dense. 
Readability counts. 


正则 表达 式 对 象 的 splitCstring[ ,maxsplit 二 0]) 方 法 用 来 实现 字符 串 分 隔 。 


>> > example- r'cne, two, three.four/five\ six? seven[eight]nine| ten" 
»»»patteme re.oapile (r' [, ./AN? [V] # 指 定 多 个 可 能 的 分 隔 符 
»»»pattern.split (example) 

['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', 'ten'] 
>>> exanple= r'oneltwo?three3four4five5six6seven7eight8nine9ten" 

>>> patterns re.onpile(r'\d ') # 使 用 数字 作为 分 隔 符 
»»»pattern.split (example) 

['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', 'ten'] 
»»»example-r'one two ^ three four,five.six.seven,eight,nine9ten" 
>>>patter re.oamile (r' [Vs, -Nd]* ') # 人 允许 分 隔 符 重复 
>>>pattem.split (example) 


['one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', 'ten'] 
3. match 对 象 


正则 表达 式 模块 或 正则 表达 式 对 象 的 match O 77 13: I search( ) 方 法 匹配 成 功 后 都 会 
返回 match 对 象 。match 对 象 的 主要 方法 有 group O (返回 匹配 的 一 个 或 多 个 子 模式 内 
容 ) .groups() (返回 一 个 包含 匹配 的 所 有 子 模式 内 容 的 元 组 ) .groupdict()( 返 回 包含 匹配 
的 所 有 命名 子 模式 内 容 的 字典 ) \start()( 返 回 指定 子 模式 内 容 的 起 始 位 置 ) .end()( 返 回 
指定 子 模式 内 容 的 结束 位 置 的 前 一 个 位 置 ) .span() (返回 一 个 包含 指定 子 模式 内 容 起 始 
位 置 和 结束 位 置 前 一 个 位 置 的 元 组 ) 等 。 下 面 的 代码 使 用 几 种 不 同 的 方法 来 删除 字符 串 
中 指定 的 内 容 : 


>>> email= "tony@ tiremove thisger.net" 


»»»m-re.search ("remove this", email) HEJ search() 方 法 返回 的 match 对 象 
>>> email[m.start ()]+ email [m.end () :] # 字 符 串 切片 

"tony@ tiger.net' 

»»»re.sub('remwe this', '', email) # 直 接 使 用 re 模块 的 sib() 方 法 
"tony tiger.net' 

»»»email.replace('remwve this', '') # 也 可 以 直接 使 用 字符 串 替 换 方法 
"tony@ tiger.net' 


下 面 的 代码 演示 了 match 对 象 的 group() ,groups() 与 groupdict() 以 及 其 他 方法 的 
用 法 : 

»» »m-re.match (z" (Vw ) (Vw )", "Isaac Newton, physicist") 

»»»m.group (0) # 返 回 整 个 模式 内 容 

"Isaac Newton" 


»»»m.group(1) # 返 回 第 1 个 子 模式 内 容 
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[4 
Ha 
»»»m.group(2) # 返 回 第 2 个 子 模式 内 容 . 
"Newton' 
»»»m.group(L, 2) # 返 回 指定 的 多 个 子 模式 内 容 


('Isaac', 'Newton') 
下 面 的 代码 演示 了 子 模式 扩展 语法 的 用 法 : 


»»»m-re.match(r"(?P« first name» Ww) (?F< last name» \wt )", "Maloolm Reynolds") 
»»»m.group('first name') # 使 用 命名 的 子 模式 
melcolm 
»»»m.group('last name') 
"Feynolds' 
»»»m-re.match(r" (Nd* )\. (Nd )", "24.1632") 
»»»m.groups() # 返 回 所 有 匹配 的 子 模式 (不 包括 第 0 个 ) 
(24^, "1622") 
»»»m-re.match(r"(?P« first name» \wt ) (? P< last name» Wt)", "Malcolm Reynolds") 
»»»m.groupdict () # 以 字典 形式 返回 匹配 的 结果 
("first name': 'Malcolm', 'last name': 'Reynolds'] 
»»»exampleString- '' "There should be one— and preferably only one— dbvious way to do it. 
Although that way may not be cbvious at first unless you're Dutch. 
Now is better than never. 
Although never is often better than right now.''" 
»»» pattern re.carmpile (r' (?< = \w\s)never (?7 \s\w) ') 

# 查 找 不 在 句子 开头 和 结尾 的 never 
»»»matchResult- pattern. search (exampleString) 
»»»matchResult.span() 
(172, 17) 
»»»pattem-re.ompile(r'(?«- WAs)never')  # 查 找 位 于 句子 末尾 的 单词 
»»»matchResult- pattern. search (exampleString) 
»»»matchResult.span() 
(156, 161) 
»»»pattern- re.compile (r' (? :isVs)better (Vsthan) ') 

# 查 找 前 面 是 is 的 better than 组 合 
»»»matchResult- pattern. search (exampleString) 
»»»matchResult.span() 
(141, 155) 
»»»matchResult.group (0) # 组 0 表示 整个 模式 
"is better than' 
>>>matchPesult.group (1) 
' than! 
»»»pattem-re.ompile(r'Vo(oi)nvwk Vo") — 担 找 以 n 或 N 字 母 开头 的 所 有 单词 
»»»index-0 
>>>while True: 

metchResult- pattern.search (exampleString, index) 
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if not matchResult: 
break 
print (matchResult.group(O), ':', matchResult.span(0)) 
index-matchResult.end (0) 
not : (92, 95) 
Now : (137, 140) 
never : (156, 161) 
never : (172, 177) 
now : (205, 208) 
»»»pattem-re.ompile(r'(?« !notVs)beVo') ”4# 查 找 前 面 没 有 单词 not 的 单词 be 
»»»index-0 
»»»while True: 
matchResult- pattern.search(exampleString, index) 
if not matchResult: 
break 
print (matchResult.group(0), ':', matchResult.span(0)) 
index-matchResult.end(0) 


be : (13, 15) 
»»»exmpleString[13:20] # 验 证 一 下 结果 是 否 正确 
二 
>>>Ppattern= re.ompile(r'(\b\w* (?P< f> Wwt ) (?P=f)\w* \b)') 

# 匹 配 有 连续 相同 字母 的 单词 
»»»index-0 


»»»while True: 
matchResult- pattern.search (exampleString, index) 
if not matchResult: 
break 
print (matchResult.group(0), ':', matchResult.group(2)) 
index-matchResult.end(0)-4 1 


"aabc abod abbad abcod abodd" 

»»»p-re.ompile(r'(VNw* (? P< f» \wt ) (?P=f)\w* Vb) *) 
»»»p.findall (s) 

[('aabc', 'a'), ('abbod', 'b'), ('abcod', 'c'), ('abodd', 'd')] 


523 案例 精 选 
例 5-3 使 用 正则 表达 式 提取 字符 串 中 的 电话 号 码 。 


inport re 
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telNumber= '''Suppose my Fhone No. is 0535- 1234567, yours is 010- 12345678, his is 025- 87654321. '' 
pattern- re.ompile(r' (\d{3, 4))- (dC, 8))') 
index-0 
while True: 
metchResult-pattern.search(telNumber, index) # 从 指定 位 置 开 始 匹配 
if not matchResult: 
break 
print ('- '* 30) 
print ('Success: ') 
for i in range(3): 
print ('Searched content:', matchResult.group(i), V 
' Start fram:', matchResult.start(i), "End at:', matchResult.end(i),V 
' Its span is:', matchResult.span(i)) 
index-matchResult.end(2) # 指 定 下 次 匹配 的 开始 位 置 


上 面 程序 的 运行 结果 如 下 : 


Searched content: 0535- 1234567 Start fram: 24 End at: 36 Its span is: (24, 36) 
Searched content: 0535 Start fram: 24 End at: 28 Its span is: (24, 28) 
Searched content: 1234567 Start fram: 29 End at: 36 Its span is: (29, 36) 


Searched content: 010- 12345678 Start fram: 47 End at: 59 Its span is: (47, 59) 
Searched content: 010 Start fram: 47 End at: 50 Its span is: (47, 50) 
Searched content: 12345678 Start fram: 5l End at: 59 Its span is: (51, 59) 


Searched content: 025- 87654321 Start fram: 68 End at: 80 Its span is: (68, 80) 

Searched content: 025 Start fram: 68 End at: 71 Its span is: (68, 71) 

Searched content: 87654321 Start fram: 72 End at: 80 Its span is: (72, 80) 

例 5-4 使 用 正则 表达 式 提取 Python 程序 中 的 类 名 、 函 数 名 以 及 变量 名 等 标识 符 。 

将 下 面 的 代码 保存 为 FindIdentifiersFromPyFile. py, 在 命令 提示 符 环境 中 使 用 命令 
"Python FindIdentifiersFromPyFile. py 目标 文件 名 ”查找 并 输出 目标 文件 中 的 标识 符 。 


finctions= [] 
variables- {'nommal':{}, ‘parameter':{}, 'infor':()] 


'''This is a test string: 
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atest, btest=3, 5 
to verify that variables in comments will be ignored by this algorithm 


def identifyClassNames (index, line): 
'''parameter index is the line number of line, 
parameter line is a line of œo of the file to deck''" 
pattern- re.oamile (r' (?« ^ class Vs) Wt (27 . * 2:)") 
matchResult- pattern. search (line) 
if not matchResult: 

retum 

className- matchResult.group (0) 
classes[className]- classes.get (className, []) 
classes [className] .append (index) 


def identifyFunctiorNames (index, line): 
pattern- re.oamile (r' (?« - defVs) (wt )\ ((.* ?)\) 97 :)*) 
matchResult- pattern. search (line) 
if not matchResult: 
retum 
functionName- matchResult.group (1) 
functions.append((functionName, index)) 
parameters- matchResult.group (2) .split(r', ') 
if parameters[0] == '': 
retum 
for v in parameters: 
variables |['parameter'] [v]- variables['parameter'].get(v, []) 
variables ['parameter'] [v] .append (index) 


def identifyVariableNames (index, line): 
#find nomal variables, including the case: a, b-3, 5 
pattern- re.oampile (r'Wo(. * 2) 2-2 Vs) ") 
matchResult- pattern.search (line) 
if matchResult: 
vs-matchResult.group(l).split(r', ') 
for v in vs: 
#consider the case 'if variable —— value" 
if 'if ' inv: 
v-v.split( [1] 
#ccnsider the case: 'a[3]- 3' 
if '[' inv: 
v=v[0:v.index(' [')] 
variables['normal'] [v]- variables['normal'].get (v, []) 
variables ['normal'] [v] -append (index) 
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#find the variables in for statements 
pattern- re.oampile (r' (?« — fors) (. * ?) (?- Vsin) ") 
matchiResult- pattern. search (Line) 
if matchResult: 
vs matchResult.group(1) .split (r', ') 
for v in vs: 
variables['infor'][v]- variables['infor'].get(v, []) 
variables['infor'] [v] -append (index) 


def output () : 
print('- '* 30) 
print ("The class names and their line numbers are:') 
for key, value in classes.items(): 
print (key, ':', value) 
print ('='* 30) 
print ("The function names and their line numbers are: ') 
for i in functions: 
Print (i[0], ':', i[1]) 
print('- '* 30) 
print ("Ihe normal variable names and their line numbers are:') 
for key, value in variables['normal'].items(): 
print(key, ':', value) 
print('- ' * 20) 
print ("The parameter names and their line numbers in functions are:') 
for key, value in variables['parameter'].items(): 
print (key, ':', value) 
print('- ' * 20) 
print ("The variable names and their line numbers in for statements are:') 
for key, value in variables['infor'].items(): 
print(key, ':', value) 


#suppose the lines of caments less than 50 
def camments (index) : 
for i in range(50) : 


line- allLines [index* i].strip() 
if line.endswith('"""')or line.endswith ("' ''"): 
retum itl 
if nme  ——-' mein ': 
fileName= sys.argv[1] # 命 令 行 参 数 


if not os.path.isfile(fileName) : 
print ('Your input is not a file. ') 
sys.exit (0) # 退 出 当前 程序 


if not fileName.endswith (' .py") : 


print('Sorry. I can only check Python source file. ') 


sys.exit (0) 


allLines- [] 


with 


cpen (£ileName, 'r')as fp: 
allLines- fp.readlines () 


index-0 
totallen- len (alllines) 
while index« totallen: 


line-allLines[index] 
strip the blank characters at both end of line 
line= line.strip() 
fignore the ocmments starting with '#' 
if line.startswith('f"): 
index +=1 
continue 
#ignore the oamments between ''' or " 


if line.startswith('"""')or line.startswith("'''"): 


index + = comments (index) 

continue 
fidentify identifiers 
.identifyClassNames (indext 1, line) 
.identifyFunctionNames (indext 1, line) 
.identifyVariableNames (index* 1, line) 
index 4-1 


output () 
Qi Bim s 5-4 和 例 5-5 的 程序 都 需要 在 命令 提示 符 环境 中 运行 ,并 提供 另 一 
个 文件 名 作为 命令 行 参数 。 
例 5-5 ”使 用 正则 表达 式 检查 Python 程序 的 代码 风格 是 否 符合 规范 。 
本 例 代码 主要 检查 Python 程序 的 一 些 基本 规范 ,例如 ,运算 符 两 侧 是 否 有 空格 ,是 
否 每 次 只 导入 一 个 模块 ,在 不 同 的 功能 模块 之 间 是 否 有 空 行 , 注 释 是 否 足够 多 ,等 等 。 


inport sys 


import re 


def checkFormats (lines, desFileName): 
fp-cpen(desFileName, "w') 
for i, line in enumerate (lines) : 


print('- '* 30) 
print ('Line:', 
if line.strip() .startswith (t '): 
print(' '* 10+ 'Comments.Pass.') 
fp.write (line) 
continue 


itl) 
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flag-True 
Scheck operator symbols 
syibols-[',*, t, fot, net, tn, tff, HR, ISSUES 
EM MEET 
temp line- line 
for synbol in symbols: 
pattern- re.oampile (r'Vs* '+ re.escape (syrbol)4 r'\s* ') 
temp line-pattern.split (temp line) 
sep-' "t syrbol+ ' ' 
temp line- sep.join(temp line) 
if line I- temp line: 
flag- False 
print(' '* 10+ "You may miss same blank spaces in this line. ') 
#check import statement 
if line.strip().startswith ('import") : 
if ',' inline: 
flag- False 
print(' ' * 10+ "You'd better import one module at a time.") 
temp line-line.strip() 
modules- temp line[temp line.index(' ')+1:] 
modules- modiles.strip() 
pattern- re.oqpile(r'As* ,\s* ') 
modules- pattern.split (modules) 
temp line-'" 
for module in modules: 
temp line += line[:line.indes ("import')]+ "import: e modilet '\n' 
line- temp line 
pri line- lines[i- 1].strip() 
if pri line and(not pri line.startswith ('import'))and V 
(not pri line.startswith(*£')): 
flag-False 
print(' '* 10 'You should add a blank line before this line.') 
line- '\n'+ line 
after line- lines[i* 1].strip() 
if after line and(not after line.startswith ('import")) : 
flag-False 
print(' '* 10 'You should add a blank line after this line.') 
line = line '\n' 
#check if there is a blank line before new funtional code block 
#including the class/function definition 
if line.strip()and not line.startswith(' ')and i» 0: 
pri line lines[i- 1] 
if pri line.strip()and pri line.startswith( '): 
flag-False 
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print (' '* 10 "You'd better add a blank line before this line.") 
line- "Ant line 
if flag: 
print(' '* 10 'Pass.') 
fp.write (line) 
fp.close() 


if mme — 
fileName- sys.argv[1] # 命 令 行 参 数 
fileLines- [] 
with open (fileName, 'r')as fp: 
fileLines- fp.readlines() 
desFileName- fileName[:- 3]+ ' new.py' 
checkFormats (filelines, desFileName) 
Scheck the ratio of comment lines to all lines 
comments [line for line in fileLines if line.strip() .startswith('#')] 
ratio- len (camments) /len (fileLines) 
if ratio «—- 0.3: 
print ('='* 30) 
print ('Camments in the file is less than 30%.') 
print('Perhaps you should add same comments at appropriate position.') 


文件 与 文件 夹 操作 
s» 3 


文件 是 长 久保 存 信息 并 允许 重复 使 用 和 反复 修改 的 重要 方式 ,同时 也 是 信息 交换 的 
重要 途径 。 数 据 库 文件 .图像 文件 音频 和 视频 文件 、 可 执行 文件 .Office 文档 动态 链 接 
库 文件 等 ,都 以 文件 的 形式 存储 在 不 同形 式 的 存储 设备 (如 磁盘 、U 盘 、 光 盘 、 云 盘 等 ) 上 。 
按 文 件 中 数据 的 组 织 形式 可 以 把 文件 分 为 文本 文件 和 二 进 制 文件 两 大 类 。 


1. 文本 文件 


文本 文件 存储 的 是 常规 字符 串 , 由 若干 文本 行 组 成 ,通常 每 行 以 换行 符 \n 结 尾 。 常 
规 字符 串 是 指 记 事 本 之 类 的 文本 编辑 器 能 正常 显示 、 编 辑 并 且 人 类 能 够 直接 阅读 和 理解 
的 字符 串 , 如 英文 字母 .汉字 ,数字 字符 串 。 在 Windows 平台 中 ,扩展 名 为 txt\log ,ini 的 
文件 都 属于 文本 文件 ,可 以 使 用 字 处 理 软 件 ( 如 gedit、 记 事 本 ) 进 行 编辑 。 


2. 二 进 制 文件 


常见 的 如 图 形 图 像 文件 .音频 和 视频 文件 .可 执行 文件 .资源 文件 ` 各 种 数据 库 文件 、 
各 类 Office 文档 等 都 属于 二 进 制 文件 。 二 进 制 文件 把 信息 以 字 节 串 (bytes) 进 行 存储 ,无 
法 用 记事 本 或 其 他 普通 字 处 理 软件 直接 进行 编辑 ,通常 也 无 法 被 人 类 直接 阅读 和 理解 , 需 
要 使 用 对 应 的 软件 进行 解码 后 读 取 、 显 示 、 修 改 或 执行 。 例 如 ,图 6-1 中 使 用 Windows id 
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本 打开 Python 主 程序 文件 pythonw. exe, 由 于 这 个 文件 是 二 进 制 可 执行 文件 ,无 法 使 
用 记事 本 查看 ,所 以 显示 乱码 。 当 然 , 也 可 以 使 用 hexeditor, 010Editor 之 类 的 十 六 进 制 
编辑 器 打开 二 进 制 文件 进行 查看 和 修改 ,但 是 这 需要 对 不 同类 型 的 二 进 制 文件 结构 有 非 
常 深入 的 理解 才 行 ,如 图 6-2 所 示 。 


lig 


iew Tools Spedalst Options Window Help BOE 


bi-maemm ARN XA 8-359330 &«»n Be 


Fie tdi Offset 61232545 57 B9 A BCDrEz-r a 


a lunregistered] 

00000000 |4D SA 90 00 03 00 00 00 04 00 00 On FF FF 00 On Mz yy pie 

00000010 |B8 CO 00 00 00 00 O0 00 40 00 00 09 O0 O0 O0 O0 |, e CAPython 35 

00000020 |00 00 O0 0O 00 O0 O0 O0 CU 00 DU 00 OU 00 OU OU 

n0000030 |00 DO oo oo oo oo oo oo o0 O0 DO on 00 D: O0 00 File size: 403KB 
41,240 bytes 


00000040 CE 1F BA DE 00 B4 09 CD 21 BO O1 4C CD 21 54 60| e ` Íl, LÍ!Th 
00000050 |69 73 20 70 72 6F 67 72 61 6D 20 63 61 6E 6E GF | is program canno Default Edit Mode 


00000060 |74 20 62 65 20 72 75 6E 20 69 6E 20 44 4F 53 20 t be run in DOS State: original 
00000070 |6D EF 64 65 2E OD OD OA 24 00 00 00 00 00 00 OC mode. PT 

00000080 |4E SA 2B 3F OA 3B 45 6C CA 3B 45 6C OA 3B 45 6C NZ+? ;El ;El ;EL Unde revereer E 
00000090 |03 43 D6 6C 0D 3B 45 6C EF 62 44 6D 08 3B 45 6C | CCl ;EL 

000000AO |EF 62 46 6D O8 3B 45 5C EF 62 40 6D 1A 3B 45 oC ibFm ;EL Creation time: 2015-12-06 
00000080 (EF 62 41 6D O1 3B 45 6C F8 62 44 6D 09 3B 45 6C | ibAm EL mv 
O00000CO |D7 C4 8E 6C 08 3B 45 6C CA 3B 44 6C 3B 3B 45 6C | xAM PIED Last write time: 2015-12-05 
000000D0 |F8 62 4D BD OB 3B 45 GC F8 62 BA BC OB 3B 45 6C | obMm ;Elebsl ;EL 0155340 
D00000ED |F8 62 47 6D 0B 3B 45 6C 52 69 63 68 DA 3B 45 5C | obGm :ElRich :El Attributes: A 
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00000120 |00 76 00 00 00 00 O0 oo 1C 13 00 00 O0 10 O0 00| v fies: hex dadiral 
00000130 |00 CO 00 1D 00 00 00 OC CO 10 00 02 00 02 00 00 Bytes per page: 3516-560 


00000140 |06 00 00 00 00 00 00 00 06 00 OO 00 00 00 00 00 
00000150 |00 DO 00 00 0D 04 00 00 06 18 01 00 03 00 60 51| 5 
00000180 |80 64 1E 00 00 00 00 00 00 10 00 00 00 00 00 OC M 
00000170 |00 00 10 00 00 00 00 00 oo 10 00 00 00 00 00 00 
00000180 |00 CO 00 09 10 00 00 00 00 00 OO 09 00 00 00 OC 


图 6-2 使 用 Winhex 十 六 进 制 编辑 器 打开 可 执行 文件 


6.1 文件 对 象 常用 方法 与 属性 


无 论 是 文本 文件 还 是 二 进 制 文件 ,其 操作 流程 基本 都 是 一 致 的 , 即 首先 打开 文件 并 创 
建文 件 对 象 ,然后 通过 该 文件 对 象 对 文件 内 容 进 行 读 取 、 写 人 人、 删除 、 修 改 等 操作 ;最 后 关 
闭 并 保存 文件 内 容 。Python 内 置 了 文件 对 象 , 通 过 open() 函 数 即 可 以 指定 模式 打开 指 
定 文件 并 创建 文件 对 象 , 该 函数 用 法 为 


open(file, mode- 'r', buffering-- 1, encoding- None, errors- None, newline= None, closefd- True, opener 
一 None) 


该 函数 的 主要 参数 含义 如 下 。 

(1) 参数 file 指定 要 打开 或 创建 的 文件 名 称 , 如 果 该 文件 不 在 当前 目录 中 , 则 需要 指 
定 完整 路 径 ,为 了 减少 完整 路 径 中 *\” 符 号 的 输入 ,可 以 使 用 原始 字符 串 。 

(2) 参数 mode( 取 值 范围 见 表 6-1) 指 定 打开 文件 后 的 处 理 方式 ,如 “只 读 ”“ 只 写 ”、 
“ 读 写 ”“ 追 加 ”“ 二 进 制 只 读 ”“ 二 进 制 读 写 ” 等 ,默认 为 “文本 只 读 模式 ”。 以 不 同方 式 打 
开 文 件 时 ,文件 指针 的 初始 位 置 略 有 不 同 ,例如 ,以 “只 读 ”" 和 “只 写 ” 模 式 打 开 文 件 时 文件 
指针 的 初始 位 置 是 文件 头 , 而 以 * 追 加 ?模式 打开 文件 时 则 文件 指针 的 初始 位 置 为 文件 尾 。 

(3) 参数 buffering 指定 读 写 文件 的 缓存 模式 ,数值 0( 只 在 二 进 制 模式 中 可 以 用 ) 表 
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示 不 缓存 ,数值 1( 只 在 文本 模式 中 可 以 用 ) 表 示 使 用 行 缓存 模式 ,大 于 1 的 数字 则 表示 组 
冲 区 的 大 小 ,默认 值 是 一 1。 当 使 用 默认 值 一 1 时 ,二 进 制 文件 和 非 交 互 式 文本 文件 以 固 
定 大 小 的 块 为 缓存 单位 ,等 价 于 io. DEFAULT. BUFFER SIZE. ZH 5k XC As X f Gsatty 
() 方 法 返回 True) 采 用 行 缓存 模式 。 

(4) 参数 encoding 指定 对 文本 进行 编码 和 解码 的 方式 ,只 适用 于 文本 模式 ,可 以 使 用 
Python 支持 的 任何 格式 , 详 见 标准 库 codecs. 

(5) 参数 newline 只 适用 于 文本 模式 , 取 值 可 以 是 None、"、An'、Nr、NrN\n 中 的 任何 
一 个 ,表示 文件 中 新 行 的 形式 。 

如 果 执 行 正 常 ,open() 函 数 返回 一 个 可 迭代 的 文件 对 象 ,通过 该 文件 对 象 可 以 对 文 
件 进 行 读 写 操作 ,如 果 指 定 文件 不 存在 .访问 权限 不 够 磁盘 空间 不 够 或 其 他 原因 导致 创 
建文 件 对 象 失败 则 抛 出 异常 。 下 面 的 代码 分 别 以 读 、 写 方式 打开 了 两 个 文件 并 创建 了 与 
之 对 应 的 文件 对 象 。 

fl-open('filel.txt', 'r') 

f2- open ('file2.txt', 'w') 

当 对 文件 内 容 操 作 完 以 后 ,一 定 要 关闭 文件 对 象 ,这 样 才能 保证 所 做 的 任何 修改 都 确 
实 被 保存 到 文件 中 。 


fl.close() 


AMER: 缓存 机 制 使 得 修改 文件 时 不 需要 频繁 地 进行 磁盘 文件 的 读 写 操作 ,而 
是 等 缓存 满 了 以 后 再 写 入 文件 ,或 者 调用 flush() 方 法 强行 将 缓存 中 的 内 容 写 入 磁盘 文 
件 ,缓冲 机 制 大 幅度 提高 了 文件 操作 过 度 ,也 延长 了 磁盘 使 用 寿命 。 

EFE: 即使 我 们 写 了 关闭 文件 的 代码 ,也 无 法 保证 文件 一 定 能 够 正常 关闭 ,例如 ， 
在 打开 文件 之 后 和 关闭 文件 之 前 发 生 了 错误 导致 程序 崩溃 。 如 果 忘 记 关 闭 文 件 或 者 关闭 
文件 的 代码 没有 得 到 执行 会 怎么 样 呢 ? 如 果 是 以 读 模式 打开 的 文件 那 一 般 没什么 ,但 是 
如 果 是 以 写 模式 或 追加 模式 打开 的 文件 对 象 ,有 可 能 会 导致 数据 并 没有 真正 写 入 磁盘 文 
件 。 如 果 被 水 平 高 超 的 黑客 盯 上 ,还 有 可 能 会 造成 内 存 数 据 的 泄露 。 


表 6-1 文件 打开 模式 


模 式 说 明 
r 读 模式 (默认 模式 ,可 省 略 ), 如 果 文 件 不 存在 则 抛 出 异常 
w 写 模 式 ,如 果 文 件 已 存在 , 先 清空 原 有 内 容 
x 写 模式 ,创建 新 文件 ,如 果 文件 已 存在 则 抛 出 异常 
a 追加 模式 ,不 覆盖 文件 中 原 有 内 容 
b 二 进 制 模式 (可 与 其 他 模式 组 合 使 用 ) 
t 文本 模式 (默认 模式 ,可 省 略 ) 
E 读 、 写 模式 (可 与 其 他 模式 组 合 使 用 
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文件 对 象 的 常用 属性 如 表 6-2 所 示 。 


表 6-2 文件 对 象 的 常用 属性 


属性 


说 有明 


closed 


判断 文件 是 否 关 闭 , 若 文件 已 关闭 则 返回 True 


mode 


返回 文件 的 打开 模式 


name 


返回 文件 的 名 称 


文件 对 象 的 常用 方法 如 表 6-3 所 示 。 特 别 说 明 的 是 ,文件 读 写 操作 相关 的 函数 都 会 


文件 指针 移 到 第 11 个 字符 ,再 次 读 取 字 符 的 时 候 总 是 从 文件 指针 的 当前 位 置 开始 读 取 。 
写 入 文件 的 操作 函数 也 具有 相同 的 特点 。 


方 ”法 


表 6-3 文件 对 象 的 常用 方法 
功能 说 明 


flush() 


把 缓冲 区 的 内 容 写 入 文件 ,但 不 关闭 文件 


close() 


把 缓冲 区 的 内 容 写 人 文件 ,同时 关闭 文件 ,并 释放 文件 对 象 


read([size]) 


从 文件 中 读 取 size 个 字 节 (Python 2. x) 或 字符 (Python 3. x) 的 内 容 作为 
结果 返回 ,如 果 省 略 size 则 表示 读 取 所 有 内 容 


readline) 


从 文本 文件 中 读 取 一 行内 容 作为 结果 返回 


readlinesC) 


把 文本 文件 中 的 每 行文 本 作为 一 个 字符 串 存 人 列表 中 ,返回 该 列表 


seekCoffset[ ，whence]) 


把 文件 指针 移 到 新 的 位 置 ,offset 表示 相对 于 whence 的 位 置 。whence 为 
0 表示 从 文件 头 开始 计算 ,1 表示 从 当前 位 置 开始 计算 ,2 表示 从 文件 尾 
开始 计算 ,默认 为 0 


tell() 


返回 文件 指针 的 当前 位 置 


truncate([size]) 


删除 从 当前 指针 位 置 到 文件 末尾 的 内 容 。 如 果 指 定 了 size, 则 不 论 指 针 
在 什么 位 置 都 只 留 下 前 size 个 字 节 ,其 余 的 删除 


write(s) 


把 字符 串 s 的 内 容 写 入 文件 


writelines(s) 


把 字符 串 列 表 写 入 文本 文件 ,不 添加 换行 符 


writable() 


测试 当前 文件 是 否 可 写 


readable() 


测试 当前 文件 是 否 可 读 


6.2 文本 文件 操作 案例 精 选 


例 6-1 向 文本 文件 中 写 信 内容。 


== 'Hello world\n 文 本 文件 的 读 取 方法 \n 文 本 文件 的 写 入 方法 \n' 
f-open('sample.txt', 'at ') # 打 开 文 件 


f.write(s) 


# 写 入 文件 内 容 
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f.close() # 关 闭 文件 

QARR: 文件 操作 一 般 都 要 遵循 "打开 文件 一 读 写 文件 一 关闭 文件 ”的 标准 套 
路 ,但 是 如 果 文 件 读 写 操作 代码 引发 了 异常 ,很 难保 证 文件 能 够 被 正确 关闭 ,使 用 上 下 文 
管理 关键 字 with 可 以 避免 这 个 问题 。 关 键 字 with 可 以 自动 管理 资源 ,不 论 因为 什么 原 
因 ( 哪 怕 是 代码 引发 了 异常 ) 跳 出 with 块 ,总 能 保证 文件 被 正确 关闭 ,并 且 可 以 在 代码 块 
执行 完毕 后 自动 还 原 进入 该 代码 块 时 的 现场 ,常用 于 文件 操作 、 数 据 库 连 接 、 网 络 通信 和 连 
接 等 场合 。 有 了 with, 再 也 不 用 担心 文件 没有 关闭 了 。 上 面 的 代码 改写 如 下 : 

S 'Hello world\n 文 本 文件 的 读 取 方 法 \n 文 本 文件 的 写 入 方法 \n' 

with open('sample.txt', 'at ')as f: 

f.write(s) 


另外 ,上 下 文 管理 语句 with 还 支持 下 面 的 用 法 : 
with open('test.txt', 'r')as src, open('test new.txt', 'w')as dst: 
dst.write (src.read()) 
EEE: 下 面 的 代码 执行 结束 后 不 会 自动 关闭 文件 对 象 。 
>>> for line in open('test.txt'): 
print (Line) 
(QARAR: 在 交互 模式 下 使 用 文件 对 象 的 write ) 方 法 写 入 文件 时 ,会 显示 成 功 
写 入 的 字符 数量 。 如 果 想 不 显示 这 个 数字 ,可 以 先导 入 sys 模块 ,然后 执行 语句 sys. 
stdout —openCnull', w^ ,这 样 再 写 入 文件 时 就 不 会 显示 写 入 的 字符 数量 了 。 
例 6-2 读 取 文本 文件 内 容 。 


»»»Ífp-cpen('sanple.txt') 


»»» print (fp.read(4)) # 从 当前 位 置 读 取 前 4 个 字符 
Bell 

»»» print (fp.read (18) ) # 英 文字 符 和 汉字 一 样 对 待 
oworld 

文本 文件 的 读 取 方法 

>>>print (fp.read()) # 从 当前 位 置 读 取 后 面 的 所 有 内 容 
文本 文件 的 写 人 方法 

>>> fp.close() # 关 闭 文件 对 象 


的 小 提示 : Python 2. x 对 中 文 支持 不 很 好 ,文件 对 象 的 read() 方 法 是 读 取 文 件 中 
指定 数量 的 字 节 。 

(以 拓展 知识 : JSON(JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 , 易 
于 阅读 和 编写 ,同时 也 易于 机 器 解析 和 生成 (一 般 用 于 提升 网 络 传输 速率 ), 是 一 种 比较 理 
想 的 编码 与 解码 格式 。Python 标准 库 json 提供 对 JSON 的 支持 ,例如 : 


>> > import json 
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»»»x-[, 2, 3] 
>>> json.dnps (x) # 对 列表 进行 编码 
"H, 2, 3" 
»»» json.loads( ) # 解 码 
[1, 2, 3] 
»»»tye() 
«class 'list'» 
>>> {'a':1, 'b':2, 'c':3) # 对 字典 进行 编码 
>>> y-json.dumps (x) 
»»»type(y) 
«class 'str'» 
>>> json.loeds (y) 
fa 1 D2 "e'e 3} 
>>>type( ) 
«class 'dict'» 
»»»fp-cpen('test.txt', 'w') 
>>> json.dump(('a':1, 'b':2, 'c':3), fp) # 对 字典 进行 编码 并 写 人 文件 
>>> fp.close() 
例 6-3 读 取 并 显示 文本 文件 的 所 有 行 。 
with open('sanple.txt')as fp: 
while True: 
line- fp.readline() 
if not line: 
break 
print (line) 
聪明 的 读者 是 否 想到 了 文件 对 象 是 可 以 迭代 的 呢 ? 如 果 想 到 了 ,也 就 不 难 理解 下 面 
的 代码 了 ,是 的 ,Python 就 是 可 以 这 么 简洁 。 
with open ('sample.txt')as fp: 
for line in fp: # 文 件 对 象 是 可 以 迭代 的 
Print (line) 
或 者 ,也 可 以 直接 使 用 文件 对 象 的 readlines() 方 法 来 实现 ,但 是 操作 大 文件 时 不 建议 
这 样 做 ,因为 这 会 消耗 大 量 的 内 存 资源 。 
with open('sanple.txt')as fp: 
lines- fp.readlines () # 操 作 大 文件 时 不 建议 这 样 使 用 
print(''.join(lines)) 
fi 6-4 移动 文件 指针 。 假 设 文件 sample. txt 中 的 内 容 原 为 "Hello world\n 文本 文 
件 的 读 取 方 法 \n 文本 文件 的 写 和 方法 ”。 


>>> fp- apen('sample-txt' ‘r+ ') 


>>> fp.tell() # 返 回 文件 指针 的 当前 位 置 
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0 
>>> fp.read (20) # 读 取 20 个 字符 

"Hello world\n 文 本 文件 的 读 取 方 " 

>>> fp.seek (13) # 重 新 定位 文件 指针 的 位 置 

13 

>>> fp.read(5) 

文本 文件 的 ' 

>>> 印 .seek(13) 

13 

>>> 外 -write(' 测 试 ) # 从 文件 指针 当前 位 置 写 入 内 容 
2 

»»»fp.flush() # 把 缓冲 区 内 容 写 人 磁盘 文件 
>>> fp.seek (0) 

0 

>>> fp.read() 

"Hello world\n 测 试 文件 的 读 取 方 法 \n 文 本 文件 的 写 入 方法 \n' 

>>> fp.close() # 关 闭 文件 


例 6-5 假设 文件 data. txt 中 有 若干 整数 ,整数 之 间 使 用 英文 逗号 分 隔 , 编 写 程序 读 
取 所 有 整数 ,将 其 按 升序 排序 后 再 写 人 文本 文件 data. asc. txt 中 。 


with open('data.txt', 'r')as fp: 


data- fp.readlines () # 读 取 所 有 行 
data- [line.strip()for line in data] # 删 除 每 行 两 侧 的 空白 字符 
data= ', ' .join(data) # 合 并 所 有 行 
data= data.split( # 分 割 得 到 所 有 数字 
data [int (item) for item in data] # 转 换 为 数字 
data.sort() # 升 序 排 序 
data- ', ' .join (map (str, data) ) # 将 结果 转换 为 字符 串 
with cpen('data asc.txt', 'w')as fp: # 将 结果 写 人 文件 
fp.write (data) 


(以 拓展 知识 : CSV(Comma Separated Values) 格 式 的 文件 常用 于 电子 表格 和 数据 


库 中 内 容 的 导入 和 导出 。Python 标准 库 csv 提供 的 reader, writer 对 象 和 DictReader 和 
DictWriter 类 很 好 地 支持 了 CSV 格式 文件 的 读 写 操作 。 另 外 ,csvkit 支持 命令 行 方式 来 实 
现 更 多 关于 CSV 文件 的 操作 以 及 与 其 他 文件 格式 的 转换 , 感 兴趣 的 朋友 可 以 参考 https:// 


source. opennews. org/en-US/articles/ eleven-awesome-things-you-can-do-csvkit/ 。 


>>> inport csv 
>>>with open('test.csv', 'w', newline- '')as fp: 
test writer- csv.writer(fp, delimiter- ' ', quotechar- '"') 
# 创 建 writer 对象 
test writer.writerow(['red', "blue', 'green']) # 写 人 一 行内 容 
test writer.writerow(['test string']* 5) 
>>> import csv 
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>>>with open ('test.csv', newline- '')as fp: 
test reader- csv.reader (fp, delimiter- ' ', quotechar- ™') 


# 创 建 reader 对 象 
for row in test reader: UBI BUR TT 
print (row) # 每 行 作 为 一 个 列表 返回 


['red', 'blue', 'green'] 
['test string', 'test string', 'test string', 'test string', 'test string'] 
»»»with open('test.csv', newline- '')as fp: 

test reader- csv.reader (fp, delimiter- ':', quotechar- '"'') 

# 使 用 不 同 的 分 隔 符 
for row in test reader: 
print (row) # 注 意 , 与 上 面 的 输出 不 同 

['red blue green'] 
['test string test string test string test string test string'] 
>>> with open('test.csv', newline- '')as fp: 

test reader- csv.reader(fp, delimiter- ' ', quotechar- '"') 

for row in test reader: 


print(', ' join (row)) # 重 新 组 织 数 据 形式 
red,blue,green 
test_string,test_string,test_string,test_string,test_string 
>>> inport csv 


>>>with open('names.csv', 'w')as fp: 
headers- [' 姓 氏 ',' 名 字 '] 
test dictWriter- csv.DictWriter(fp, fieldnames- headers) 
# 创 建 Dicticiter Xl e 


test dictiriter.writeheader () # 写 人 表 头 信息 
test_dictWriter.writerow({' 姓 氏 ':' 张 ', ' 名 字 ':' 三 '}) 
# 写 人 数据 


test dictWriter.writerow({" 姓 氏 ':" 李 '，' 名 字 ':" 四 ') 
test dictWriter.writerow(("lIE [& i E ', "M E tinh t) 

>>> inport csv 

>>>with open ('names.csv')as fp: 
test dictReader- csv.DictReader (fp) # 创 建 mictFeader 对 象 
Frint (', ' .join (test dictReader.fieldnares)) # 读 取 表 头 信息 
for row in test dictReader: # 遍 历 文件 所 有 行 

print (row[' 姓 氏 '],",',row[' 名 字 ']) 

姓氏 ,名 字 

张 ,三 

李 ,四 

E EIS 


例 6-6 编写 程序 ,保存 为 demo. py, 运 行 后 生成 文件 demo. new. py, 其 中 的 内 容 与 
demo. py 一 致 ,但 是 在 每 行 的 行 尾 加 上 了 行 号 。 


filename 'demo.py* 
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with open(filename, 'r')as fp: 


lines- fp.readlines () # 读 取 所 有 行 
maxlength= max (map (len, lines) ) # 最 长 行 的 长 度 
for index, line in enumerate (lines) : B8 BUS 11 
newLine- line.rstrip() # 删 除 每 行 右 侧 的 空白 字符 
newline-newLinet ' '* (fnaxLengtht 5- len (newLine)) 
# 在 每 行 固定 位 置 添 加 行 号 
newLine- newLinet '#'+ str (index 1)+ '\n' # 添 加 行 号 
lines[index]- newline 
with qen (filename[:- 3]+ ' new.py', 'w')as fp: # 将 结果 写 入 文件 


fp.writelines (lines) 
例 6-7 计算 文本 文件 中 最 长 行 的 长 度 和 该 行 的 内 容 。 


with copen('sanple.txt')as fp: 
result- [0, ''] 
for line in fp: 
t-len(line) 
if t» result[0] : 
result- [t,line] 


print (result) 
例 6-8 Python 程序 代码 复 用 度 检 查 。 


fram os.path import isfile as isfile 
fram time import time as time 


Result- () 

AllLines- [] 

FileName- r'XueshengKacQin.pyw" 

fFileName- input ('Please input the file to check, including full path:') 


#Read the content of given file 
fRemove all the whitespace string of every line, 
fpreserving only one space character between words or operators 
fnote:The last line does not contain the 'An' character 
def Preoperate () : 
glcbal AllLines 
with cpen(FileName, 'r', encoding- 'utf- 8')as fp: 
for line in fp: 
line-' '.join(line.split()) 
AllLines.append (line) 


#Check if the current position is still the duplicated one 
def IfHasDuplicated (Indexl) : 
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for item in Result.values(): 
for it in item: 


retum it[1] #retum the span 
return False 


#If the current line Index? is in a span of duplicated lines, return True, felse False 
de£ IsInSpen (Index?) : 
for item in Result.values|(): 
for i in item: 
if i[0] <= Index i[0]t i[1]: 
retum True 
return False 


def MainCheck() : 
gldbal Result. 
Totallen- len (AllLines) 
Indexl- 0 
while Indexl« Totallen- 1: 
#speed up. 
span- IfHasDuplicated (Indexl) 
if span: 
Indexl += span 
continue 
Index2- Indexl* 1 
while Index2< Totallen: 
#speed up, skip the duplicated lines 
if IsInSpan (Index2) : 
Index +=1 
continue 
so" 
ds" 
for i in range(10): 
if Index2* i >=Totallen: 
break 
src +=AllLines[Indexl+ i] 
des +=Al]Lines [Index2 i] 
if sc -- des: 
t-Result.get (Indexl, []) 
for tt int: 
if tt[0] == JIndex2: 
tt[l]=i+1 
break 
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t.append([Index2, i+1]) 
Result[Indxl]-t 
else: 
break 
t-Result.get (Indexl, []) 
for tt int: 


SOptimize the Result dictionary, remove the items with spanc 3 
Result[Indexl]- Result.get (Indexl, []) 
for n in Result [Indexl] [::- 1]: #Note: here mist use the reverse slice, 
if n[1]« 3: 
Result [Indexl] .remove (n) 
if not Result [Indexl]: 
del Result [Indexl] 


#Compute the min span of duplicated codes of line Indexl,modify the step #Indexl 
æ [ttt[1] for ttt in Result.get(Indexl, [[Indexl, 1]])] 
ifa: 
Indexl +=max(a) 
else: 
Indxl +=1 


#Output the result 
def Output () : 
print('- ' x 20) 
print ('Result:') 
for key, value in Result.items(): 
print ("The original line is: Wn (0)' format AllLines[key])) 
print('Its line number is (0)'.format (key 1)) 
print ('The duplicated line nurbers are:') 
for iin value: 
print(* Start:', i[0], ' Span:', i[1]) 
print('- ' * 20) 
print('- ' x 20) 


if isfile(FileName): 
start-time() 
PreOperate () 
MainCheck() 


第 6 章 文件 与 文件 夹 操作 和 217 
e 


Output () 
print('Time used:', time ()- start) 


6.3 二进制 文件 操作 案例 精 选 


数据 库 文件 图像 文 件 .可 执行 文件 动态 链接 库 文件 .音频 文件 .视频 文件 .Office 文 
档 等 均 属于 二 进 制 文件 。 对 于 二 进 制 文件 ,不 能 使 用 记事 本 或 其 他 文本 编辑 软件 直接 进 
行 正常 读 写 ,也 不 能 通过 Python 的 文件 对 象 直接 读 取 和 理解 二 进 制 文件 的 内 容 。 必 须 
正确 理解 二 进 制 文件 的 结构 和 序列 化 规则 ,然后 设计 正确 的 反 序列 化 规则 ,才能 准确 地 理 
解 二 进 制 文件 内 容 。 

所 谓 序列 化 ,简单 地 说 就 是 把 内 存 中 的 数据 在 不 丢失 其 类 型 信息 的 情况 下 转换 成 对 


和 json, 其 中 ,json 常用 于 文本 信息 的 序列 化 ,在 6.2 节 中 已 经 介绍 了 。 
631 使 用 picde 模 块 读 写 二 进 制 文件 


Python 标准 库 pickle 提供 的 dump() 方 法 用 于 将 数据 进行 序列 化 并 写 和 文件 (dump() 
方法 的 protocol 参数 为 True 时 可 以 实现 压缩 的 效果 ) ,而 load() 用 于 读 取 二 进 制 文件 内 
容 并 进行 反 序列 化 ,还 原 为 原来 的 信息 。 

例 6-9 使 用 pickle 模块 写 人 二 进 制 文件 。 


import pickle 


n-7 

i= 13000000 

a= 99.056 

s- "中 国人 民 123abc' 

1st- [[1, 2, 3], [4, 5, 61, (7, 8, 9]] 
tu- (- 5, 10, 8) 


coll- (4, 5, 6) 

dic ('a':'apple', 'b':'banana', 'g':'grape', 'o':'orange') 

f-open('sample pickle.dat', wb") # 以 写 模式 打开 二 进 制 文件 

try: 
pickle.dmp(n, 日 # 对 象 个 数 
pickle.dmp(i, f) # 写 人 整数 
pickle.dmp(a, f) # 写 人 实数 
pickle.dmp(s, 日 # 写 人 字符 串 
pickle.dmp(1st, f) # 写 入 列表 
pickle.dmp(tu, f) # 写 人 元 组 
pickle.dmp(coll, f) # 写 和 人 集合 


pickle.dmp(dic, f) # 写 入 字典 
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exoept: 
print(' 写 文件 异常 ') 
finally: 
f.close() 


例 6-10 使 用 pickle 模块 读 取 例 6-9 中 写 和 二进制 文件 的 内 容 。 
import pickle 


f£-cpen('samle pickle.dat', 'rb') 
r-pickle.load(f) # 读 出 文件 的 数据 个 数 
for iinrange(n): 
x-pickle.load(f) 
print (x) 
f.close() 


的 小 提示 : pickle 模块 还 提供 了 一 个 dumps() 方 法 ,可 以 返回 对 象 序列 化 之 后 的 
字 节 形式 ,例如 : 

»»»pickle.dmps ([1,2,3]) # 序 列 化 列表 

b'\x80\x03]q\ x00 (KV x01KN x02KNx03e.. " 


»»»pickle.dumps ([1,2,3,4]) 
b'\xB80\x03]q\x00 (KV xOTKV x02K\ x03K V x04e.. " 


»»»pickle.dmps ((,2,3,4]) # 序 列 化 集合 
b'\x80\x03cbuiltins\nset\ng\x00]q\ x01 (K\xO1K\ x02K\ x03K\ x04e\x85d\ x02RA\x03." 
»»»pickle.dups ((1,2,3)) 

b'\x80\x03cbui Leine V nset ng Vx00] qv x01 (K\x01K\x02K\ x03e\x85q\x02Ra\ x03." 
»»»pickle.dmps ((,2,3)) # 序 列 化 元 组 

b' \x80\x03K\ x01K\ x02K\ x03\ x87q\ x00. ' 

>>>pickle.dmps (123) # 序 列 化 数字 
b'\x80\x03K{." 


Bg ERAR: 下 面 的 代码 可 以 用 来 把 文本 文件 转换 为 二 进 制 文件 , 其 中 ,test. txt 是 
包含 若干 文本 信息 的 源 文件 ,test_pickle. dat 是 转换 后 的 二 进 制 文件 ,注意 with 语句 的 
用 法 。 


»»»import pickle 
>>> with cpen('test.txt')as src, cpen('test pickle.dat', 'wb')as dest: 
lines- src.readlines () 
pickle.dump (len (lines), dest) 
for line in lines: 
pickle.dump(line, dest) 
>>> with cpen('test pickle.dat', 'rb')as fp: 
n pickle.loed(fp) 
for i inrange(n): 
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print (pickle.load(fp)) 


632 使 用 struct 模块 读 写 二 进 制 文件 


使 用 struct 模块 需要 使 用 pack() 方 法 把 对 象 按 指 定 个 数 进行 序列 化 ,然后 使 用 文件 
对 象 的 write() 方 法 将 序列 化 的 结果 写 人 二 进 制 文件 ; 读 取 时 需要 使 用 文件 对 象 的 read() 
方法 读 取 二 进 制 文件 内 容 , 然 后 再 使 用 struct 模块 的 unpack() 方 法 反 序 列 化 得 到 原来 的 
信息 。 

例 6-11 使 用 struct 模块 写 人 二 进 制 文件 。 


inport struct 


rr 1300000000 
x- 96.45 

b= True 

s-'ale rig " 

sn- struct .pack ('à£? ', n, x, b) # 序 列 化 ,i 表示 整数 ,f 表 示 实 数 ,? 表 示 逻 辑 值 
f-cpen('samle struct.dat', "wb') 

f.write(sn) 

f.write(s.encode ()) # 字 符 串 需要 编码 为 字 节 串 再 写 人 文件 
f.close() 


例 6-12 使 用 struct 模块 读 取 例 6-11 中 二 进 制 文件 的 内 容 。 
import struct 


f= apen('sample struct.dat', 'rb') 
sre £.read(9) 

tæ struct.unpack('if? ', sn) # 使 用 指定 格式 反 序 列 化 
print (tu) 

n, X, bl-tu 

print('ne ',n, 'x- ',x, 'bl- ',bl) 

s f.read(9) 

s= s.deoxde () # 字 符 串 解 码 


print('s- ', s) 


的 小 提示 : 在 上 面 的 代码 中 ,可 能 读者 会 疑 怠 如 何 确定 要 读 取 几 个 字 节 , 为 什么 是 
9 而 不 是 其 他 数字 呢 ? 看 完 下 面 的 代码 应 该 能 够 明白 了 。 


>> > import struct 

>> > struct.pack('if? ', 13000, 56.0, True) 
b'\xc82\x00\x00\x00\x00`B\ x01" 

>>>len() 

9 

»»»len(struct.pack('if?', 9999, 5336.0, False)) 
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9 

>>> 'al8 中 国 ' 
>>> len(x.encode()) 
9 


633 使 用 shave 模 块 操作 二 进 制 文件 


Python 标准 库 shelve 也 提供 了 二 进 制 文件 操作 的 功能 ,可 以 像 字典 赋值 一 样 来 写 人 
二 进 制 文件 ,也 可 以 像 字典 一 样 读 取 二 进 制 文件 ,有 点 类 似 于 后 面 第 8 章 介 绍 的 NoSQL 
数据 库 MongoDB。 


>> > import shelve # 导 和 shelve 模 块 
>>> fp- shelve.apen('shelve test.dat') # 创 建 或 打开 二 进 制 文件 
>>> zhangsan- ('age':38, 'sex':'Male', 'address':'SDIBT') 

>>> fp['zhangsan']- zhangsan # 写 入 文件 内 容 
>>> lisi= ('age':40, 'sex':'Male', 'qg':'1234567', 'tel':'7654321') 

>>> fp['lisi']- lisi # 写 人 文件 内 容 
>>> 印 .close() # 关 闭 文件 
»»»fp-shelve.open('shelve test.dat') 

»»» print (fp['zhangsan'] ['age']) # 查 看 文件 内 容 
38 

»»» print (fp['lisi']['qz']) 

1234567 

>>> fp.close() 


634 使 用 mrsa 模块 操作 二 进 制 文件 
Python 标准 库 marshal 也 可 以 进行 对 象 的 序列 化 和 反 序 列 化 ,下 面 的 代码 进行 了 简 


单 演示 。 
> > > inport marshal # 导 入 模块 
»»»xl-30 # 待 序列 化 的 对 象 
>>>x2- 5.0 


»»»x3 [1, 2,3] 
>>>x4= (4, 5, 6€) 
»»»3x5- ('a':l, 'b':2, 'c':3) 
>>>x6 {7, 8, 9) 
>>> [eval ('x'"+ str (i))for i inrange(1,7)]  # 把 需要 序列 化 的 对 象 放 到 一 个 列表 中 
>>>x 
[30, 5.0, [1, 2, 3], (4, 5, €, {'a': 1, 'b': 2, 'c': 3), (8, 9, 7}] 
>>> with cpen('test.dat', 'wb')as fp: # 创 建 二 进 制 文件 
marshal .dump (len (x), fp) # 先 写 人 对 象 个 数 
for item in x: 


marshal.dump (item, fp) # 把 列表 中 的 对 象 依次 序列 化 并 写 人 文件 
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>>>with open('test.dat', 'rb')as fp: # 打 开 二 进 制 文件 
mmarshal.load(fp) # 获 取 对 象 个 数 
fori in range(n): 

print (marshal.load(fp)) # 反 序列 化 ,输出 结果 

30 

5.0 

[1, 2, 3] 

(4, 5, 6) 

('a': 1, 'b': 2, 'c': 3) 

18, 9, 7) 


6.4 文件 与 文件 夹 操作 


641 标准 库 os、ospath 5 shiil 简介 


os 模块 除了 提供 使 用 操作 系统 功能 和 访问 文件 系统 的 简便 方法 之 外 ,还 提供 了 大 量 
文件 与 文件 夹 操 作 的 方法 ,如 表 6-4 所 示 。os. path 模块 提供 了 大 量 用 于 路 径 判断 、 切 分 、 
连接 以 及 文件 夹 遍历 的 方法 ,如 表 6-5 所 示 。shutil 模块 也 提供 了 大 量 的 方法 支持 文件 和 
文件 夹 操作 ,常用 方法 如 表 6-6 所 示 。 

表 6-4 os 模块 常用 成 员 


方 法 功能 说 明 
access(path, mode) 按照 mode 指定 的 权限 访问 文件 
chdir( path) 把 path 设 为 当前 工作 目录 


chmod(path. mode. * . dir fd— None. 


follow. symlinks— True) 改变 文件 的 次 辣 权 限 

extsep 当前 操作 系统 所 使 用 的 文件 扩展 名 分 隔 符 
fstat(path) 返回 打开 的 文件 的 所 有 属性 
get_exec_path() 返回 可 执行 文件 的 搜索 路 径 

getcwd() 返回 当前 工作 目录 

listdir(path) 返回 path 目录 下 的 文件 和 目录 列表 
mkdir(path[ ，mode 一 0777]) 创建 目录 


makedirsCpathl/path2…，mode 一 511) | 创建 多 级 目录 


open(path. flags. mode = 00777, * , | 按照 mode 指定 的 权限 打开 文件 ,默认 权限 为 可 读 、 可 写 、 
dir fd= None) 可 执行 
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r> 
续 表 
5 法 功能 说 明 
rmdir( path) 删除 目录 ,目录 中 不 能 有 文件 或 子 文件 夹 
remove( path) 删除 指定 的 文件 
removedirsCpathl/path2…) 删除 多 级 目录 ,目录 中 不 能 有 文件 
rename(src, dst) 重 命名 文件 或 目录 ,可 实现 文件 的 移动 
scandir(path—* ) 返回 包含 指定 文件 夹 中 所 有 DirEntry 对 象 的 迭代 对 象 
sep 当前 操作 系统 所 使 用 的 路 径 分 隔 符 
startfile(filepath [, operation]) 使 用 关联 的 应 用 程序 打开 指定 文件 或 启动 指定 应 用 程序 
stat(path) 返回 文件 的 所 有 属性 
truncate(path, length) 将 文件 截断 ,只 保留 指定 长 度 的 内 容 
walk(top, topdown — True, onerror— | 遍历 目录 树 ,该 方法 返回 一 个 元 组 ,包括 3 个 元 素 : 所 有 路 
None) 径 名 、 所 有 目录 列表 与 文件 列表 
writeCfd, data) 将 bytes 对 象 data 写 入 文件 fd 


X 6-5 os. path 模块 常用 成 员 


5 È 功能 说 明 
abspath(path) 返回 给 定 路 径 的 绝对 路 径 
basename( path) 返回 指定 路 径 的 最 后 一 个 组 成 部 分 
commonpath( paths) 返回 给 定 的 多 个 路 径 的 最 长 公共 路 径 
commonprefix( paths) 3& |l A s AI A 1- Pre D RC DJ RT AR 
dirname( p) 返回 给 定 路 径 的 文件 夹 部 分 
exists(path) 判断 文件 是 否 存在 
getatime(filename) 返回 文件 的 最 后 访问 时 间 
getctime(filename) 返回 文件 的 创建 时 间 
getmtime( filename) 返回 文件 的 最 后 修改 时 间 
getsize(filename) 返回 文件 的 大 小 
isabs(path) 判断 path 是 否 为 绝对 路 径 
isdir(path) 判断 path 是 否 为 文件 夹 
isfileCpath) 判断 path 是 否 为 文件 


join(path. * paths) 连接 两 个 或 多 个 path 
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续 表 
5o d 功能 说 明 
splitC path) 对 路 径 进 行 分 隔 ,以 列表 形式 返回 
splitext(path) 从 路 径 中 分 隔 文件 的 扩展 名 
splitdrive(path) 从 路 径 中 分 隔 驱动 器 的 名 称 


表 6-6 shuti 模块 常用 成 员 


方 法 功能 说 明 
copyfile(sre, dst) 复制 文件 
copytree(src，dst) 递归 复制 文件 夹 
disk usage(path) 查看 磁盘 使 用 情况 
move(sre, dst) 移动 文件 或 递归 移动 文件 夹 
rmtree(path) 递归 删除 文件 夹 
TO Pr | 
essei (filename, extract dir — None, 解压 缩 文件 


下 面 通过 几 个 示例 来 演示 os os. path 以 及 shutil 模块 的 基本 用 法 。 


>>> inport os 
>>> inport os.path 


>>> os.path.basename ('C:\ \windows\ \notepad.exe') 


'notepad.exe' 

>>> os.path.basename ('C:\ \windows') 
uis 

»»»0s.path.exists ('test].txt!) 
False 


# 获 取 路 径 的 最 后 一 个 组 成 部 分 


# 测 试 文件 是 否 存在 


>> > ce.rename('C:\\testl.txt',，'D:\\test2.txt') # 源 文件 不 存在 , 重 命名 失败 


File "«pyshell£150» ", line 1, in «module» 


os.rename ('C:\\testl.txt', 'D:\\test2.txt') 


FileNotFoundError: [WinError 2] 系统 找 不 到 指定 的 文件 。: 'C:\\testl.txt' -> 'D:\\test2.txt' 


>>>os.rename ('C:\\dfg.txt', 'D:\\test2.txt') 


>>> os.path.exists('C:\\dfg.txt') 

False 

>>>os.path.exists('D:\\test2.txt') 

Tue 

»»»path- 'D: Wnypython exp\\new test.txt' 
>> > 05.path.dirname (path) 

"D:\ \mypython exp" 

>>> os.path.split (path) 


#0s.rename() 可 以 实现 文件 的 改名 和 移动 


# 返 回路 径 的 文件 夹 名 


# 切 分 文件 路 径 和 文件 名 
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('D:\\mypython exp', "new test.txt') 
>>> os.path.splitdrive (path) 

('D:', '\\mypython exp\\new test.txt') 

>> > os.path.splitext (path) # 切 分 文件 扩展 名 

('D:\\mypython exp\\new test, '.txt') 

»»»print([fname for fname in os.listdir(os.getowd())if os.path.isfile (fname)and fname.endswith(' .pyc 
"Qn 

['consts.pyc', 'database demo.pyc', 'nqueens.pyc'] 


»»»0s.getowd() # 返 回 当 前 工作 目录 
"CNN Python35* 

>>> os. mkdir (os.getcwd ()+ '\ \terp') # 创 建 目录 
>>>os.chdir(os.getcwd(0+ '\ \terp') # 改 变 当前 工作 目录 
>>>os.getcwd() 

1C:\ \Python35\ \ terp" 


>>> os.mkdir(os.getcwd()+ '\\test') 

»»»0s.listdir('.') 

['test'] 

»»»os.müir ('test') # 删 除 目录 
»»»0s.listdir('.') 

0 

»»»os.path.camonpath ([r'C:\windows\notepad.exe', r'C:\windows\system']) 


'C:\\windows' 

>>> os.path.camonpath([r'a\b\c\d', r'a\b\c\e']) 

"abc? 

»»»os.path.camonprefix ([r'a\b\c\d', r'a\b\c\e']) 

ta\\b\\c\\' 

>>> inport shutil # 导 入 shutil 模 块 

>>> shutil.copyfile('C: NM dir.txt', 'C:\\dirl.txt') # 复 制 文件 

下 面 的 代码 将 C:\Python34\Dlls 文件 夹 以 及 该 文件 夹 中 所 有 文件 压缩 至 D: Va. zip 
文件 : 

>>> shutil .make archive('D:\\a', 'zip', 'C:\\Python34', 'Dlls') 

'D:Na.zip' 


下 面 的 代码 则 将 刚 压缩 得 到 的 文件 D Va. zip 解压 缩 至 Di Na. unpack 文件 夹 : 
>>> shutil .unpack archive('D:\\a.zip', 'D:\\a_unpack') 

下 面 的 代码 使 用 shutil 模块 的 方法 删除 刚刚 解压 缩 得 到 的 文件 夹 : 

>>> shutil.mtree('D:\\a_unpack') 


Python 标准 库 shutil 的 rmtree() 函数 还 支持 更 多 的 参数 ,例如 ,可 以 使 用 onerror & 
数 指定 回调 函数 来 处 理 删 除 文件 或 文件 夹 失败 的 情况 : 


>> > import os 
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>>> inport stat 

>>> inport shutil 

>>> def remve readonly(func, path, _): # 定 义 回调 函数 
os.dhmod(path, stat.S IWRITE) # 删 除 文件 的 只 读 属性 
func (path) # 再 次 执行 删除 操作 

>>> shutil.mtree('D:Wdes test!) # 文 件 夹 中 有 一 个 只 读 文件 


Traceback (most. recent. call last): 
File "c pyshellł2D ", line 1, in «module» 
shuti1.mmtree("D:\\des test') 
File "C:\Python35\1ib\shutil .py", line 488, in mtree 
retum rmtree unsafe (path, onerror) 
File "C:\Python35\ lib\shutil.py", line 383, in rmtree unsafe 
onerror(os.unlink, fullname, sys.exc info()) 
File "C:\Python35\1ib\shutil .py", line 381, in rmtree unsafe 
os.unlink (fullname) 
PermissionError: [WinError 5] 拒绝 访问 。: 'D:\\des_test\\test1.txt' 
>>> shutil.mtree('D:\\des_test', onerror- remove readonly) 
# 指 定 回调 函数 ,删除 成 功 


下 面 的 代码 用 来 递归 复制 文件 夹 ,并 忽略 扩展 名 为 pyc 的 文件 和 以 “新 "开头 的 文件 
和 子 文件 夹 : 


>>> frm shutil import oopytree, ignore patterns 
>>> oopytree('C:\\python35\\test', 'D:\\des_ test', ignore- ignore pattems('* .pyc', ' 新 * ')) 


如 果 需 要 遍历 指定 目录 下 的 所 有 子 目 录 和 文件 ,可 以 使 用 递归 的 方法 ,例如 : 
import os 


def visitDir(path): 

if not os.path.isdir (path): 
print('Error:"', path, '" is not a directory or does not exist.') 
retum 

for lists in os.listdir (path) : 
sub path= os.path.join(path, lists) 
print(sub path) 
if os.path.isdir(sub path): 

visitDir(sub path) # 递 归 调 用 


visitDir ('E:\\test') 
下 面 的 代码 使 用 os 模块 的 walk() 方 法 进行 指定 目录 的 遍历 。 
import os 


df visitDir? (path) : 
if not os.path.isdir (path) : 
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print('Error;"', path, '" is not a directory or does not exist. ') 
retum 
list dirs-os.walk(path) 


for root, dirs, files in list dirs: # 饥 有 历 该 元 组 的 目录 和 文件 信息 
for d in dirs: 
print (os.path. join (root, d)) # 获 取 完 整 路 径 
for f in files: 


print (os.path.join (root, 日 ) # 获 取 文 件 的 绝对 路 径 


visitDir2('h:N music!) 

'O 拓展 知识 ， 除了 用 于 文件 操作 和 文件 夹 操 作 的 方法 之 外 ,os 模块 还 提供 了 大 量 
其 他 方法 。 例 如 ,system() 方 法 可 以 用 来 执行 外 部 程序 或 系统 内 置 命令 ,popen() 和 
startfile() 也 可 以 用 来 启动 外 部 程序 。 另 外 ,Python 标准 库 subprocess 也 提供 了 大 量 与 
进程 创建 与 管理 有 关 的 对 象 ,pywin32 工具 包 提 供 的 ShellExecute() 和 CreateProcess() 
函数 ,这 些 对 象 和 函数 也 可 以 实现 启动 外 部 程序 的 目的 。 如 果 对 Python 标准 库 ctypes 
和 系统 API 函数 熟悉 ,也 可 以 直接 调用 底层 API 函数 实现 更 加 高 级 的 功能 。 


>>> import subprocess 
>>> h= sutprocess. Fopen (' ', executable- 'C:\\windows\ \notepad.exe') 
# 打 开 记事 本 程序 
»»»h.temirate() # 结 束 进程 
>>> hr subprocess.Popen ('', executable- 'C:\\windows\ \notepad.exe') 
# 打 开 记事 本 程序 
»»»h.kill( # 结 束 进程 
>> > os.popen ('C:\ \windows\ \notepad.exe') # 打 开 记事 本 程序 
>>> inport os 
>>>os.startfile(r'C:\windows\notepad.exe') ”所 J 开 记 事 本 程序 
>> > os.startfile (r'test.py') # 执 行 Python 程序 
>>> import win32api 
>> > win32api .ShellExecute (0, 'open', 'notepad.exe', '', '',0) 
#0 表示 后 台 运 行程 序 
42 
>> > win32api .ShellExecute (0, 'open', "notepad.exe', '', '',1) 
大 表示 前 台 运 行程 序 
42 
>> > win32api .ShellExecute (0, 'open', 'notepad.exe', 'C:\\dir.txt', '',1) 
# 打 开 指 定 文件 
42 
>> > win32api .ShellExecute (0, 'open', 'ww.python.org', '', '',1) 
# 打 开 网 址 
42 


2»»win2api.ShellExecute (0, 'open',r'C:Mdir.txt', '', '',1) 


# 相 当 于 双击 文件 
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42 
>>> inport win32process 
>>> handle= win32process.CreateProoess (r'C: VwindowsVnotepad.exe', '', None, None, 0, win32process. 
CREATE NO WINDOW, None, None, win32process.STARTUPINFO ()) 
# 打 开 记事 本 程序 
> > > win3?process.TerminateProcess (handle[0], 0) # 关 闭 程序 
>>> handle= win32process.CreateProcess (r'C: windows Vnotepad.exe', '', None, None, 0, win32process. 
CREATE NO WINDOW, None, None, win32prooess.STARTUPINEO()) 
>>> inport win32event 
>>> win32event .WaitForSingleCbject (handle[0] ,- 1) 
# 需 要 手动 关闭 记事 本 


642 案例 精 选 
例 6-13 将 当前 目录 的 所 有 扩展 名 为 html 的 文件 重 命名 为 扩展 名 为 htm 的 文件 。 


import os 


file list- os.listdir(".") 
for filename in file list: 
pos- filename.rindex(".") 
if filename [post 1:] == "html": 
newname- filename[:post 1] "htm" 
os.rename (filename, newname) 
print (filename "更 名 为 :"+ newname) 


当然 ,也 可 以 改写 为 下 面 的 简洁 而 等 价 的 代码 : 
import os 


file list- [fileneme for filename in os. listdir(".")if filename.endswith(' .html ') ] 
for filename in file list: 

newname- filename[:- 4]+ 'htm" 

os.rename (filename, newname) 


print (filename "更 名 为 :"+ newname) 
例 6-14 计算 文件 的 CRC32 ff. 
inport sys 
import zlib 
inport os.path 


filename= sys.argv[1] 
if os.path.isfile (filename) : 
fp-cpen(filename, 'rb') 
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contents- fp.read() 

fp.close( 

print (zlib.crc32 (contents.enoode () )) 
else: 

print('file not exists') 


"OUR AUR « CRC 又 称 为 循环 宛 余 检验 码 ,常用 于 数据 存储 和 通信 领域 ,具有 极 强 
的 检 错 能 力 。CRC32 产生 校 验 值 时 源 数据 块 的 每 一 个 bit( 位 ) 都 参与 了 计算 ,所 以 数据 
块 中 即使 只 有 一 位 发 生 了 变化 ,也 会 得 到 不 同 的 CRC32 值 ,也 可 用 于 文件 完整 性 保护 。 

例 6-15 判断 一 个 文件 是 否 为 GIF 图 像 文 件 。 任 何 一 种 文件 都 具有 专门 的 文件 头 
结构 ,在 文件 头 中 存放 了 大 量 的 信息 ,其 中 就 包括 该 文件 的 类 型 。 通 过 文件 头 信息 来 判断 
文件 类 型 的 方法 可 以 得 到 更 加 准确 的 信息 ,而 不 依赖 于 文件 扩展 名 。 


>>> def is gif (fname) : 
f-cpen(fname, 'r') 
first4- tuple (f .read (4) ) 
f.close() 
return first4-- ('G', 'I', 'F', '8") 
>>>is gif ('C:\\test.gif') 
Tue 
>>>is gif('C:Wdir.txt') 
False 


例 6-16 使 用 xlwt 模块 写 人 Excel 文件 。 


frm xlwt import * 


book= Workbock () # 创 建新 的 Excel 文件 
sheetl-book.add sheet ("First") # 添 加 新 的 worksheet 
al- Alignment () 

al.horz- Alignment.HORZ CENTER # 对 齐 方式 

al.vert- Alignment.VERT CENTER 

borders Borders () 

borders.bottam- Borders. THICK # 边 框 样式 

style= XFStyle() 


Style.alignment- al 
Style.borders- borders 


Tow0- sheetl.row(0) # 获 取 第 0 行 
rowW0.write(0, 'test', style= style) # 写 人 单元 格 
bock.save (r'D:Vtest.xls') # 保 存 文件 


SAMER: xlwt 和 下 面 一 个 案例 用 到 的 xlrd 都 是 用 来 操作 Excel 2003 之 前 版 本 
的 Python 扩展 库 , 上 默认 没有 安装 ,可 以 使 用 pip 进行 安装 。 
例 6-17 使 用 xlrd 模块 读 取 Excel 文件 。 
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>>> inport xlrd 

>>>book=xlrd.open workbook(r'D:Vtest.xls') 打开 Excel X ff 
»»»sheetl-book.sheet by name('First') # 打 开 worksheet 

>>> row0= sheet1.row(0) # 获 取 第 0 行 

>>>print (row0[0]) # 查 看 该 行 第 0 个 单元 格 信息 
text:u'test" 

»»» print (ro«0 [0] .value) # 查 看 单元 格 中 的 内 容 

test 


fj 6-18 使 用 Pywin32 操作 Excel 文件 。 


xlApp- win32cam.client.Dispatch ('Excel .Application') 


HIF Excel 程序 
xlBook- xlApp.Workbooks Open ('D:NM xls") # 打 开 Excel 文件 
xlSht- x1Book.Worksheets ('sheet1') # 打 开 worksheet 
aaa- xlSht.Cells(l, 2) .Value # 访 问 单元 格 的 内 容 


xlSht.Cells(2, 3) .Valuer aaa 
xlBook.Close (SaveChanges- 1) 
del xlApp 


(QARAMA: Pywin32 模块 需要 单独 安装 ,这 是 一 个 功能 非常 强大 的 模块 ,提供 了 


Windows 底层 API 函数 的 封装 ,使 得 可 以 在 Python 中 直接 调用 Windows API 函数 , 支 
持 大 量 的 Windows 底层 操作 。 

(中 拓展 知识 : Python 标准 库 ctypes 提供 了 访问 DLL 动态 链接 库 的 功能 ,很 好 地 支 
持 了 与 C/C++ 等 语言 混合 编程 的 需求 ,也 可 以 调用 系统 底层 API 函数 。 下 面 给 出 三 段 
代码 来 演示 如 何 通 过 Python 标准 库 ctypes 来 调用 Windows API 实现 特定 功能 ,这 部 分 
内 容 涉及 Windows 系统 底层 的 知识 ,感觉 有 难度 的 读者 可 以 选择 跳 过 。 


1. 监视 用 户 计算 机 桌面 窗口 焦点 的 变化 情况 


fram ctypes import * 
fram time import sleep 
fram datetime import datetime 


# 方 便 调用 Windows 底层 API 函数 
user32- windll.user32 

kernel32- windll.kernel32 

psapi- windll.psapi 


# 实 时 查看 当前 窗口 

def getProcessInfo() : 
glcbal windows 
# 获 取 当 前 位 于 桌面 最 顶端 的 窗口 句柄 
hwnd= user32.GetForegrouncWi ndow () 
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pid-c ulong(0) 

# 获 取 进 程 ID 

user32.GetWindowIhreadProcessId (hwnd, byref (pid)) 

processId- str (pid.value) 

# 获 取 可 执行 文件 名 称 

executable- create string buffer(512) 

h prooess- kernel32.0penProcess (0x400| 0x10, False, pid) 
psapi.GetModuleBaseNameA (h process, None, byref (executable), 512) 
# 获 取 窗 口 标题 

windowlitle- create string buffer (512) 
user3?.GetWindowTextA (hwnd, byref (windowTitle), 512) 

# 关 闭 句柄 

kerne132.CloseHandle (hwnd) 

kernel32.CloseHandle (h prooess) 

# 更 新 最 近 两 个 窗口 列表 

windows.pop (0) 

windows.append ( [executable.value.decode ('gok') ,windowTitle.value.decode 
Cgok*))) 


def main(): 
gldbal windows 
windows- [None, None] 
while True: 
getProcessInfo () 
# 如 果 用 户 切换 窗口 则 进行 提示 
if windows[0] !— windows[1]: 
print('- '* 30) 
print (str (datetime.now () ) [119] windows [0] , "==> ' ,windows[1]) 
sleep (0.2) 


if nme — 


mein() 
2. 查 杀 Windows 系统 中 指定 的 进程 


fram ctypes.wintypes import * 
fram ctypes import * 


kernel32- windll.kernel32 


class tagPROCESSENTRY32 (Structure) : # 定 义 结构 体 
_fields = [('dwSize', DWORD), 
('entUsage' , DWORD), 
("th32ProcessID', DWD), 


("th32DefaultHeapID', POINTER (ULENG)) , 


第 6 章 文件 与 文件 夹 操作 b 231 
e 


("th32ModuleID', DWORD), 
('ontThreads', DWORD), 
('th3?ParentProcessID', DWORD), 
('pcPriClassBase', IONS), 
(diFlags', DWORD), 
('szExeFile', c char * 26] 
def killProcess (processNames) : 

# 创 建 进程 快照 

hSnapshot- kernel 32.CreateToolhelp32Snapshot (15, 0) 

fProcessEntry32- tagPROCESSENTRY3? () 

if hSnapshot: 


fProcessEntry32.dwSize- sizeof (fProcessEntry32) 
hasmore- kernel32.Prooess3?First (hSnapshot, byref (fProcessEntry32)) 
# 枚 举 进 程 
while hasmore: 
# 可 执行 文件 
prooessName = (fProcessEntry32.szExeFile) 
BER ID 
prooessID- fProcessEntry32.th32ProcessID 
if processName.decode () .1ower () in processNames: 
# 获 取 进 程 句柄 
hProcess- kerne132.0penProcess (l, False, processID) 
# 结 束 进程 
kemel32.TeminateProcess (hProcess, 0) 
# 获 取 下 一 个 进程 
hasmore- kernel32.Process32Next (hSnapshot, byref (fProcessEntry32) ) 


# 待 查 杀 的 进程 列表 
ProcessNames — ('notepad.exe', 'mspaint.exe') 
killProcess (processNames) 


3. 实时 显示 鼠标 所 处 窗口 的 文本 


fram ctypes import * 
fram ctypes import wintypes 
fram time import sleep 


# 调 用 Windows 系统 动态 链接 库 user32.d11 
user32- windll.user32 

p= wintypes.FOINT () 

buffer-create string buffer (255) 


while True: 
sleep(0.5) 
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# 获 取 鼠 标的 位 置 
user3?.GetCursorPos (byref (p) ) 

# 获 取 鼠 标 所 处 位 置 的 窗口 句柄 
Hind user32.WindowFramPoint (p) 


# 注 释 掉 的 代码 本 来 是 可 以 用 星 号 密码 查看 的 ,但 在 Windows 7 以 后 的 系统 中 失效 了 


#dwStyle= user32.GetWindowLongh (Hind, — 16) 
fuser32.SetWindowiord (Hind, — 16, 0) 

sleep (0.2) 

# 获 取 窗 口 文本 


user32.SendMessageA (Hind, 13, 255, byref (buffer)) 


#user32.SetWindowLongA (Hind, - 16, dwStyle) 
print (buffer.value.decode ('gok') ) 


$-16JÉ aw. sryIE 消 息 的 值 


#13 是 wM_GeTrexT 消息 的 值 


例 6-19 检查 Word 文档 的 连续 重复 字 。 在 Word 文档 中 ,经 常会 由 于 键盘 操作 不 


inport sys 


filename- sys.argv[1l] 

word- client.Dispatch ('Word.Application') 
doc- word. Doaments.Open (filename) 
content= str (doc.Content) 

doc.Close() 

word.Quit () 


repeatedWords- [] 


lens- len (content) 
for i in range(lens- 2): 
d content [i] 
chl= content [i* 1] 
ch2- content [i+ 2] 
#\u4e00 至 \u9fa5 是 汉字 Unicode 编码 范围 


if(u'Vu4e00'« — d« - u'VuSfa5' or ch in(*,', 'e ', V!) 
if dr = dil and ch chl mot in repeatediords: 


print (ch chl) 
repeatediords.append (cht chl) 


elif dr- - d? and ch chl+ ch2 not in repeatedWords: 


print (cht chl+ ch?) 
repeatediiords append (cht chl+ ch2) 


例 6-20 ”编写 程序 ,进行 文件 夹 增 量 备份 。 


小 心 而 使 得 文档 中 出 现 连续 的 重复 字 ,例如 ,用 户 的 的 资料 ”或 需要 需要 用 户 输入 ”之 类 
的 情况 。 本 例 使 用 Pywin32 模块 中 win32com 对 Word 文档 进行 检查 并 提示 类 似 的 重复 
汉字 。 


HIF wor 
HIF wora X fft 
# 获 取 文件 内 容 
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程序 功能 与 用 法 : 指定 源 文件 夹 与 目标 文件 夹 ,自动 检测 自 上 次 备份 以 来 源 文件 夹 
中 内 容 的 改变 ,包括 修改 的 文件 .新 建 的 文件 .新 建 的 文件 夹 等 ,自动 复制 新 增 或 修改 过 的 
文件 到 目标 文件 夹 中 , 自 上 次 备份 以 来 没有 修改 过 的 文件 将 被 忽略 而 不 复制 ,从 而 实现 增 
量 备份 。 本 例 属于 系统 运 维 的 范畴 。 


inport os 
import fileam 
import shutil 
inport sys 


def autcBaclup (scrDir, dstDir): 
if((not os.path.isdir (scrDir))or (not os.path.isdir (dstDir))or 
(os.path.abspath (scrDir) != scrDir)or (os.path.abspath (dstDir) != dstDir)) : 
usage() 
for item in os.listdir (scrDir): 
ScrItem- os.path.join(scrDir, item) 
dstItem- scrItem.replace (scrDir,dstDir) 
if os.path.isdir(scrItem): 
# 创 建新 增 的 文件 夹 ,保证 目标 文件 夹 的 结构 与 原始 文件 夹 一 致 
if not os.path.exists (dstTtem) : 
os.makedirs (dstItem) 
print ('make directory' dstItem) 
# 递 归 调 用 自身 函数 
autcBackup (scrItem, dstItem) 
elif os.path.isfile (scrItem): 
# 只 复制 新 增 或 修改 过 的 文件 
if((not os.path.exists (dstItem))or 
(not fileamp.amp(scrlItem, dstItem, shallow-False))): 
shutil .oopyfile (scrItem, dstItem) 
print ('file:'+ scrItemt 一 = > '+ dstItem) 


def usage) : 
print ('scrDir and dstDir mist be existing absolute path of certain directory') 
print('For example:(0) c:\\olddir c:\\newdir' . format (sys.argv [0]) ) 


sys.exit (0) 
if nme ==" main — 
if len(sys.argv) = 3: 
usege() 


ScrDir, dstDir- sys.argv[1], sys.argv[2] 
autcBackup (scrDir, dstDir) 
例 6-21 编写 程序 ,统计 指定 文件 夹 大 小 以 及 文件 和 子 文件 夹 数量 。 本 例 也 属于 系 
统 运 维 范畴 ,可 用 于 磁盘 配额 的 计算 ,例如 E-mail, 博客、 FTP、 快 盘 等 系统 中 每 个 账号 所 
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占 空间 大 小 的 统计 。 


inport os 


for lists in os.listdir (path): 
sub path- os.path.join(path, lists) 
if os.path.isfile(sub path): 


fileNum- fileNum 1 # 统 计 文 件数 量 

totalSize- totalSize* os.path.getsize(sub path) # 统 计 文 件 总 大 小 
elif os.path.isdir (sub path): 

dirue dirum 1 # 统 计 文件 夹 数量 

visitDir (sub path) # 递 归 遍 有 历 子 文件 夹 


def main (path) : 
if not os.path.isdir (path) : 
print('Error:"', path, '" is not a directory or does not exist.') 
retum 
visitDir (path) 


def sizeConvert (size) : # 单 位 换算 
K, M, G= 1024, 1024**2, 1024**3 
if size >=G: 
retum str (size/G)+ 'G Bytes' 
elif size >=M: 
retum str (size/M)+ 'M Bytes' 
elif size »-K: 
retum str (size/K)+ 'K Bytes' 
else: 
retum str (size) 'Bytes" 


ef output (path) : 
print ("The total size of '+patht ' is:'+ sizeConvert (totalSize)+ ' ("+ str (totalSize)+ ' Bytes) ') 
print ("The total mmber of files in '+patht ' is:',fileNum) 
print ("The total mmber of directories in '+patht ' is:',dirNum) 
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path- r'd:\ idapro6.5plus' 

main (path) 

output (path) 
例 6-22 编写 程序 ,统计 指定 目录 所 有 C++ 源 程序 文件 中 不 重复 代码 行 数 。 
本 例 只 考虑 C++ 源 程序 文件 (扩展 名 为 cpp) ,并 且 只 认为 严格 相等 的 两 行为 重复 行 。 


fram os.path inport isdir, join 
fram os import listdir 


NotRepeatedLines- [] # 保 存 非 重复 的 代码 行 
file nwe 0 # 文 件数 量 
code nme 0 # 代 码 总 行 数 


def LinesCount (directory) : 
global NotRepeatedLines 
global file num 
gldbal oode num 


for filename in listdir (directory): 
temp- join(directory, filename) 
if isdir(temp): 338-38 75 T 3c (EC 
LinesCount (temp) 
elif temp.endswith(!.qgp!) : # 只 考虑 .cp 文件 
file nm 4-1 
with open(temp, 'r')as fp: 


NotRepeatedLines.append (Line) # 记 录 非 重复 行 
code nm+=1 # 记 录 所 有 代码 行 
path= r'C:\Users\ Dong\Desktop\ V+ + 6.0" 
print ("总 行 数 :{0}, 非 重复 行 数 :{1}'.fommat (oode num, len (NotRepeatedLines))) 
linescount (path) 
print(" 文 件数 量 : (0) format (file num) 
例 6-23 ”编写 程序 ,递归 删除 指定 文件 夹 中 指定 类 型 的 文件 。 
本 例 代码 也 属于 系统 运 维 范畴 ,可 用 于 清理 系统 中 的 临时 垃圾 文件 或 其 他 指定 类 型 
的 文件 , 稍 加 扩展 还 可 以 删除 大 小 为 0 字 节 的 文件 ,大 家 可 以 自行 补充 和 完成 。 
fram os.path import isdir, join, splitext 
fram os import remove, listdir 
inport sys 
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filetypes ['.tmp', '.log', '.dbj', '.txt'] # 指 定 要 删除 的 文件 类 型 


def delcertainFiles (directory): 
if not isdir (directory): 
retum 
for filename in listdir (directory): 
temp= join (directory, filename) 


if isdir(temp): 
delCertainFiles (temp) # 递 归 调 用 

elif splitext (tem) [1] in filetypes: # 检 查 文件 类 型 
remove (terp) # 删 除 文件 


print (terp, ' deleted ') 


def main() : 
directory- r'E:\new' 
#directory= sys.argv[1] 
delCertainFiles (directory) 


main() 
如 果 文 件 夹 中 有 带 特殊 属性 的 文件 或 子 文件 夹 ,上 面 的 代码 可 能 会 无 法 删除 带 特 殊 
属性 的 文件 ,利用 Python 扩展 库 pywin32 可 以 解决 这 一 问题 。 


inport win32con 

: inapi 

inport os 

from win32con import FILE ATTRIBUTE NORMAL 


def del dir(path): 
for file in os.listdir (path) : 
file or dir-os.path.join (path, file) 
if os.path.isdir(file or dir)and not os.path.islink(file or dir): 


del dir(file or dir) # 递 归 删除 子 文件 夹 及 其 文件 
else: 

try: 
os.remove(file or dir) 尝试 删除 该 文件 

except: # 无 法 删除 ,很 可 能 是 文件 拥有 特殊 属性 
win32api.SetFileAttributes(file or dir, FIE ATTRIBUTE NORMAL) 
os.remove (file or dir) # 修 改 文件 属性 ,设置 为 普通 文件 ,再 次 删除 

os.mdir (path) # 删 除 文件 夹 


del dir("E:\\old") 


(以 拓展 知识 ， 系统 运 维 涵盖 的 内 容 非常 多 ,还 包括 电力 系统 维护 、 数 据 库 维护 、 磁 盘 
配额 \ 用 户 账号 与 权限 、 网 络 设备 与 带宽 分 配 、 病 毒 防护 与 入 侵 检测 、 系 统 资源 分 配 等 。 前 
面 几 个 案例 都 属于 系统 运 维 的 范畴 ,另外 , 跨 平台 的 Python 扩展 库 psutil 可 以 用 来 查询 
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进程 或 CPU、 内 存 、 硬 盘 以 及 网 络 等 系统 资源 占用 率 等 信息 ,常用 于 系统 运行 状态 检测 和 


维护 。 可 以 使 用 pip 工具 安装 该 库 。 
(1) 查看 CPU 信息 。 


»»»psutil.cpu oount() 
»»»psutil.cpu count (logical- False) 
>>>psutil.cpu percent () 
>>>psutil.cpu percent (percpu- True) 
»»»psutil.cpu times() 


(2) 查看 开机 时 间 。 


>>> inport datetime 
»»»t-psutil.boot time() 


HEA cE0 核 数 

# 查 看 物理 CEU 个 数 

# 查 看 CPU 使 用 率 

# 查 看 每 个 CPU 的 使 用 率 
# 查 看 CEU 时 间 分 配 情况 


>>> datetime.datetime.froamtimestamp (t) .strftime ('%Y- $m- $d SH:%M:%S") 


12015- 12- 26 11:32:17" 
(3) 查看 内 存 信息 。 


>>> Virtual memory-psutil.virtual memory() 
>>>virtual memory.total /1024/1024/1024 
>>>virtual memory.used/1024/1024/1024 

>>> Virtual memory.free/1024/1024/1024 

>>> virtual mempry.Percent 


(4) 查看 磁盘 信息 。 
>>>psutil.disk partitions () 
>>>psutil.disk usage('C:\\') 
»»»psutil.disk io counters (perdisk= True) 
(5) 查看 与 网 络 连接 有 关 的 信息 。 
»»»psutil.net connections () 
»»»psutil.net io counters () 
»»»psutil.net if addrs() 

(6) 查看 当前 登录 用 户 信息 。 
»»»psutil.users() 

CO 查看 进程 信息 。 


»»»psutil.pids() 
»»»p-psutil.Process (4204) 
»»»p.name() 
»»»p.username () 
»»»p.auline() 
»»»p.owd() 


# 内 存 总 大 小 
# 已 使 用 内 存 
# 空 闲 内 存 

# 内 存 使 用 率 


# 查 看 所 有 分 区 信息 
# 查 看 指定 分 区 的 磁盘 空间 情况 
# 查 看 硬盘 读 写 操作 情况 


# 查 看 网 络 连接 情况 
# 查 看 收发 包 情 况 
# 查 看 网 络 地 址 


# 查 看 当前 所 有 进程 TD 

# 获 取 指 定 IDÍDUERER 

# 进 程 名 

# 查 看 创建 该 进程 的 用 户 名 
# 查 看 该 进程 对 应 的 exe 文 件 
# 查 看 该 进程 的 工作 目录 
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»»»p.exe() # 进 程 对 应 的 可 执行 文件 名 

»»»p.qu affinity() # 该 进程 ceu 占用 情况 运行 在 哪个 cu 上 ) 
»»»p.num threads() # 该 进程 包含 的 线程 数量 

»»»p.threads () # 该 进程 所 有 线程 对 象 

»»»p.status() # 进 程 状 态 

»»»p.is running() # 进 程 是 否 正 在 运行 

>>>p.suspend() # 挂 起 进程 

»»»p.resume() # 恢 复 运 行 

>>>p.kill() # 结 束 进 程 


(8) 检查 记事 本 程序 是 否 在 运行 ,如 果 在 运行 则 返回 记事 本 程序 对 应 的 进程 ID。 


>>> for pid in psutil.pids(): 
try: 
if os.path.basename (p.exe () )- — 'notepad.exe' : 
print (pid) 
exoept: 
pass 


(9) 查看 指定 进程 的 信息 ,如 线程 数量 ,打开 的 文件 ,用 户 账 户 等 。 


»»»psutil. psutil windows.proc username (7660) 
#7660 是 进程 D 
'dfg- FO\\dfg' 
»»»psutil. psutil windows.proc open files (7660) 
['\\Device\ \HarddiskVolume1\ \Windows\ \System32', '\\Device\ KsecDD'] 
>>>psutil. psutil windows.proc threads (4636) 
# 查 看 功 为 4636 的 进程 中 的 线程 信息 
»»»psutil. psutil windows.proc exe (5424) # 查 看 IDH 5424 的 进程 可 执行 文件 
"\\Device\ \Harddi skvolume1 \ \ Python35\ \pythonw.exe' 


(10) 查看 指定 进程 的 线程 信息 ,包括 线程 数量 和 所 用 CPU 时 间 。 


import psutil 
import os 


Bí JT R c4 MAIT 00 PEE ERR D 
for pid in psutil.pids(): 
try: 

# 获 取 进 程 对 应 的 可 执行 文件 
exeFile= os-path.basename (proc.exe () ) 
# 获 取 该 进程 的 所 有 线程 信息 
threads-psutil. psutil windows.proc threads (pid) 
times- 0 
B8 D VGIERE (BUR RE 
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for thread in threads: 
# 下 标 为 0 的 元 素 是 线程 ID, 后 面 是 每 个 ceu 上 的 运行 时 间 
for timeUsed in thread[1:]: 
times += timeUsed 
print('-'* 20) 
print ('Exe file:', os.path.basename (proc.exe () ) ) 
print ('Number of threads:', len (threads)) 
print('Time used:', times) 
exoept: 
pass 


(QARAR: 正如 前 面 所 说 ,系统 运 维 涉及 面 非常 广 ,也 包括 系统 中 进程 的 创建 与 
结束 、 系 统 服务 状态 等 。 下 面 再 通过 Python 扩展 库 wmi( 该 模块 提供 了 对 Windows 
Management Instrumentation 的 访问 ) 来 演示 一 下 这 两 个 方面 的 内 容 。 

(OD 监视 Windows 系统 中 进程 创建 情况 。 


import wmi 


c= wni .WMI () 

process watcher- c.Win32 Prooess.watch for('creation') 

while True: 

try: 
new prooess- process watcher () 
proc owner- '(0[0])A (0 [1] )' -£ormat (new process.GetOwner () ) 
temp creation date- new process.CreationDate 
creation date- temp creation date[:4] 
foriin(4, 6: 
creation date += '- '+ terp creation date[i:i+ 2] 
creation date +=" " 
for i in(8, 10, 12): 
creation date += temp creation date[i:it 2]* ':" 
creation date- creation date[:- 1] 
executable- new prooess.ExecutablePath 
cmdline= new process.CoammandLine 
pid- new process.ProcessId 
parent pid-new process.ParentProcessId 
print('- '* 30) 
print ('Process owner:'.ljust(18), proc owner) 
print ("Creation Time:'.ljust(18), str(creation date)) 
print ('Executable:'.ljust(18), executable) 
print ('Qmiline:'.ljust(18), amdline) 
print ('ProcessId:' .1just (18), pid) 
print('Parent ProcessId:'.ljust(18), parent pid) 
except: 
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pass 
(2) 查看 Windows 系统 中 的 服务 状态 。 


import itertools 
import wmi 


def group (service): 
if service.State == 'Stopped': 


result- dict () 


c= wmi WMI () 

for servioe in c.Win32 Service(): 
state- service.State 
caption- service.Caption 
t= result.get (state, []) 
t.append (caption) 
result[state]- t 


for state, captions in result.items(): 
print('- '* 30) 
print (state) 
print ('\n' . join (sorted (captions))) 


506-24 使 用 扩展 库 openpyxl i3 Excel 2007 及 更 高 版 本 的 Excel 文件 。 


import openpyxl 

fram openpyxl import Workbook 

fæ r'f:\test.xlsx' # 文 件 名 

w= Workbook () # 创 建 工作 簿 
ws-wb.create sheet (title= "你 好 ,世界 ') # 创 建 工 作 表 

wla ' 这 是 第 一 个 单元 格 ' # 单 元 格 赋值 

ws['B1']- 3.1415926 

wb.save (£n) # 保 存 Excel 文件 

wb- openpyxl.load workbook (fn) # 打 开 已 有 的 Excel 文件 
ws=wb.worksheets[1] # 打 开 指 定 索引 的 工作 表 
print (us ['A1'] .value) # 读 取 并 输出 指定 单元 格 的 值 
ws.append ([1,2,3,4,5]) # 添 加 一 行 数据 
ws.merge cells('F2:E3') # 合 并 单元 格 


ws['E2']- "= sum(A2:E2)" # 写 人 公式 


for r in range (10,15) : 
for c in range 3,8) : 
| —ws.cell(row-r, colum-c, value-r* c) 
wb.save (fn) 
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# 写 人 单元 格 数据 


假设 某 学 校 所 有 课程 每 学 期 允许 多 次 考试 ,学 生 可 随时 参加 考试 ,系统 自动 将 每 次 成 
绩 添加 到 Excel 文件 (包含 3 列 : 姓名 、 课 程 、 成 绩 ) 中 , 现 期 末 要 求 统 计 所 有 学 生 每 门 课 
程 的 最 高 成 绩 。 下 面 的 代码 首先 模拟 生成 随机 成 绩 数据 ,然后 进行 统计 分 析 。 


import openpyxl 
fram openpyxl import Workbook 
import randam 


# 生 成 随机 数据 
def generateRandcmInformaticn (filename) : 
workbook- Workbook () 
worksheet- workbock.worksheets [0] 
worksheet append ( [rfe 4 *, ' 课 程 ', RSE) 
# 中 文 名 字 中 的 第 一 .第 二 ,第 三 个 字 
first- tuple(' 赵 钱 孙 李 ') 
middle= tuple ("FE B] S fy ") 
last- tuple ("Hh fé dis ") 
BERE 
subjects = (' 语 文 W, E 
# 随 机 生成 200 个 数据 
for i in range (200) : 
line- [] 
r= randam.randint (1, 100) 
name- randam.choice (first) 
# 按 一 定 概率 生成 只 有 两 个 字 的 中 文 名 字 
if r> 50: 
name= namet+ randam. choice (middle) 
name= namet randcm.choice (last) 
# 依 次 生成 姓名 ,课程 名 称 和 成 绩 
line.append (name) 
line.append (randam. choice (subjects) ) 
line.append (randam. randint (0, 100) ) 
worksheet append (Line) 
# 保 存 数 据 , 生 成 Excel 2007 格 式 的 文件 


workbock.save (filename) 


def getResult (oldfile, newfile): 
# 用 于 存放 结果 数据 的 字典 
result=dict () 


# 打 开 原 始 数据 
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workbock- openpyxl.loed workbook (oldfile) 
worksheet workbook worksheets [0] 

388 Ui E te CR 

# 跳 过 第 0 行 的 表 头 

for row in worksheet.rows[1:]: 


# 姓 名 、 课 程 名 称 、 本 次 成 绩 


name, subject, grade- row[0] .value, row[1].value, row[2].value 


# 获 取 当 前 姓名 对 应 的 课程 名 称 和 成 绩 信 息 
HUR result 字 典 中 不 包含 , 则 返回 空 字典 
t-result.get (name, (]) 
# 获 取 当 前 学 生 当前 课程 的 成 绩 , 若 不 存在 ,返回 0 
f-t.get (subject, 0) 
# 只 保留 该 学 生 该 课程 的 最 高 成 绩 
if grade» f: 
t[subject]- grade. 
result [name]- t 
# 创 建 Excel 文件 
workbookl- Workbook () 
worksheetl- workbookl.worksheets [0] 
worksheet1 append (["IfE 4 * , "BEBE *, "IARE ']) 
PH result 字典 中 的 结果 数据 写 入 Excel 文件 
for name, t in result.items(): 
for subject, grade in t.items(): 
worksheetl.append([name, subject, grade]) 
workbookl.save (newfile) 


if name  --' main ': 
oldfile- r'D:Ntest.xlsx" 
newfile- r'D:Vresult.xlsx' 
generateRandcamInfonmation (oldfile) 
getResult(oldfile, newfile) 


Bi 6-25 ”编写 代码 ,查看 指定 ZIP 和 RAR 压缩 文件 中 的 文件 列表 。 


Python 标准 库 zipfile 提供 了 对 ZIP 和 APK 文件 的 访问 。 


>>> inport zipfile 
>>> fp=zipfile.ZipFile (r'D:\Jakstab- 0.8.3.zip") 
>>> for f in fp.namelist(): 


print (f) # 如 果 中 文 显 示 乱 码 可 以 参考 例 6- 29 进 行 修改 


>>> fp.close() 


Python 扩展 库 rarfile( 可 通过 pip 工具 进行 安装 ) 提 供 了 对 RAR 文件 的 访问 。 


>>> inport rarfile 
»»»r-rarfile.RarFile (r'D: Vasp Fd 3l .rar') 
»»»forfinr.namelist(): 
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print (f) 
>>>r.close() 


例 6-26 小 学 口算 题库 生成 器 。 


document- Document () 
# 创 建 表格 
table- document.add table (rows= rowsNumber, cols- colummsNuniber) 
# 饥 历 每 个 单元 格 
for row in range (rowsNimber) : 
for col in range (columsNunter) : 
first- randmm.randint (1, biggest) 
second randam.randint (1, biggest) 
cperator- randam.choice (operators) 
if operator !—'(': 
if operator == '— ': 
# 如 果 是 减法 口算 题 ,确保 结果 为 正 数 
if first« second: 
r-str(first).ljust(2, ' ')* ' '+ operator\ 
+ str (second) .ljust 
qu t typtst 
else: 
# 生 成 带 括号 的 口算 题 ,需要 3 个 数字 和 2 个 运算 符 
third randem. randint (1, 100) 
while True: 
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ol= randam.choice (operators) 
o2= randam.choice (operators) 
if ol !='(' and 2 ! 
break 
rr-random.randint (1, 100) 
if r> 50: 
if œ2=='—':; 
if seconck third: 
second, third- third, second 
r-str(first).ljustQ, ' ')* olt '(* N 
+ str(seomng).ljustQ, ' ')+o2+ str (third) .1just (2, ' ")e ')-" 


else: 
ifol2-'—': 
if first« second: 
first, second- second, first 
r-'('*str(first).ljust(2, ' ')* ol V 
+ str(second) .ljust (2, ' ')+ ')' \ 
+o% str (third) .ljust (2, ' 0)+ '- " 
# 获 取 指 定单 元 格 并 写 人 口算 题 
cell= table.cell (row, col) 
cell.text- r 


if nme  --' main ': 
#tkinter 编程 知识 请 参考 第 15 章 
ap tkinter.Tk() 
app.title ('KouSuan —— by Dong Fuguo') 
app['width']- 300 
apgp['beight!]- 150 
labelNunber- tkinter.label(app, text= 'Number:', justify- tkinter.RIGHT, 
width= 50) 
labelNunber.place (x= 10, y= 40, width= 50, height- 20) 
carboNurber- tkinter.ttk.Cambobox (app, values- (100,200, 300, 400, 500) , 
width- 50) 
canbcoNurber.place (x= 70, y- 40, width= 50, height= 20) 


labelGrade- tkinter.Iabel(app, text= 'Grade:', justify- tkinter.RIGHT, 
width= 50) 

labelGrade.place (x= 130, y= 40, width= 50, height- 20) 

conboGrade= tkinter.ttk.Combabox (app, values- (1,2,3,4,5), width= 50) 

carboGrade.place (x= 200, y= 40, width- 50, height= 20) 


def generate() : 
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runber- int (ombatmber.get ()) 

grade= int (omboGrade.get ()) 

main (mmber, grade) 
buttonGenerate= tkinter.Button (app, text= 'GO', width= 40, cammand- generate) 
buttonGenerate.placœ (x= 130, y= 90, width= 40, height= 30) 


app-mainloop() 

ANER: 例 6-26 的 代码 需要 先 使 用 pip 工具 安装 扩展 库 python-docx。 

(如 拓展 知识 : Python 程序 编译 与 打包 。 学 到 这 里 ,相信 很 多 读者 已 经 能 够 编写 出 
一 些 程序 来 实现 自己 需要 的 功能 了 ,然后 应 该 会 有 一 个 很 大 的 疑问 : 难道 Python 程序 只 
能 以 源 代 码 的 方式 来 运行 吗 ? 能 不 能 通过 某 种 方式 来 保护 自己 的 源 代码 呢 ? 答案 是 肯定 
的 。 下 面 我 们 就 来 补充 一 下 这 方面 的 技术 。 一 种 方法 是 把 Python 程序 伪 编 译 成 扩展 名 
为 pyc 的 字 节 码 文件 ,一 种 是 通过 py2exe 或 pyinstaller 对 Python 程序 进行 打包 。 

(D Python 程序 伪 编 译 。 

可 以 使 用 py. compile 模块 的 compileO $ 4t 3} Python 程序 进行 编译 得 到 扩展 名 为 
pyc 的 字 节 码 以 提高 加 载 和 运行 速度 ,同时 还 可 以 隐藏 源 代 码 。 另 外 ,Python 还 提供 了 
compileall 模块 ,其 中 包含 compile_dir() .compile_file() 和 compile_path() 等 方法 ,用 来 
支持 批量 Python 源 程序 文件 的 编译 。 另 外 ,也 可 以 在 命令 提示 符 环境 中 使 用 “python -m 
py. compile file. py” 来 编译 Python 程序 文件 file. py, 或 者 “python -O -m py. compile 
file. py” 或 “python -OO -m py. compile file. py” 进 行 优化 编译 。 

(2) Python 程序 打包 。 

把 Python 程序 转换 为 exe 版 本 可 执行 程序 之 后 再 发 布 ,可 以 在 没有 安装 Python 环 
境 和 扩展 库 的 Windows 平台 上 运行 ,这 个 功能 极 大 地 方便 了 用 户 。 为 了 将 Python 程序 
转换 为 exe 可 执行 文件 ,需要 用 到 py2exe 和 distutils 模块 。 当 然 ,首先 应 保证 Python 程 
序 可 以 正常 运行 ,并 且 本 机 已 安装 了 所 有 需要 的 扩展 模块 和 相关 的 动态 链接 库 文件 。 

例如 ,假设 有 Python 源 程序 文件 test. py, 然 后 编写 setup. py 文件 ,内 容 为 

inport distutils 

import py2exe 

distutils.core.setup(console- ['test.py']) 

然后 在 命令 提示 符 下 执行 下 面 的 命令 : 

python setup.py py2exe 

接 下 来 就 会 看 到 控制 台 窗 口中 大 量 的 提示 内 容 飞 快 地 闪 过 ,这 个 过 程 会 自动 搜集 
test. py 程序 执行 所 需要 的 所 有 支持 文件 ,如 果 创 建成 功 则 会 在 当前 文件 夹 下 生成 一 个 
dist 子 文件 夹 ,其 中 包含 了 最 终 程 序 执行 所 需要 的 所 有 内 容 。 等 待 编译 完成 以 后 ,将 dist 
文件 中 的 文件 打包 发 布 即 可 。 

py2exe 模块 的 详细 用 法 可 以 查阅 有 关 资 料 , 但 是 对 于 一 般 应 用 而 言 ,上 面 的 代码 已 
经 足够 了 。 唯 一 要 注意 的 问题 是 ,对 于 控制 台 应 用 程序 ,要 想 转 换 为 exe 可 执行 程序 直接 
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套用 上 面 的 代码 框架 即 可 ,只 需要 把 
distutils.core.setup (console- ['test.py']) 


这 行 代 码 中 的 文件 名 替换 为 自己 的 Python 程序 文件 名 即 可 。 而 对 于 GUI 应 用 程序 ,还 
需要 将 上 面 代 码 中 的 关键 字 console 修改 为 windows。 

另外 一 个 比较 好 用 的 Python 程序 打包 工具 是 pyinstaller, 可 以 通过 pip 工具 进行 安 
装 。 安 装 之 后 在 命令 提示 符 环 境 中 使 用 命令 “pyinstaller -F -w kousuan. pyw” 即 可 将 
Python 程序 kousuan. pyw 及 其 所 有 依赖 包 打 包 成 为 kousuan. exe 可 执行 文件 ,从 而 脱离 
Python 解释 器 环境 而 独立 运行 于 Windows 系统 。 

例 6-27 将 docx 文档 中 的 题库 导入 SQLite 数据 库 。 


#dbcx 文 档 题库 包含 很 多 段 ,每 段 一 个 题目 ,格式 为 :问题 。 ER) 

# 数 据 库 datase.db 中 tilm 表 包含 kechengningcheng, zhangjie,timn,daan 四 个 字段 
# 数 据 库 有 关 知 识 可 以 查看 本 书 第 8 章 

inport sqlite3 

fram docx import Document 


doc- Document (《 Python 程序 设计 ) 题 库 .docx') 


# 连 接 数 据 库 
conn= sqlite3.connect ('database.db') 


cur- conn.cursor () 


# 先 清空 原来 的 题 ,可 选 操作 
cur.execute ('delete fram tiku') 


conn.camit () 


for p in doc.paragraphs: 
text- p.text 
if '(' in text and ')' in text: 
index- text.index(' (') 
# 分 离 问 题 和 答案 
question- text [:index] 
if' — 'inquestion: 
question- "填空 题 :'- question 
else: 
question- "Fl IB :'+ question 
answer- text [index* 1:- 1] 
# 将 数据 写 人 数据 库 
sql 'insert into tiku(kechengningcheng, zhangjie, timu, daan) values 
("Python 程 序 设计 "," 末 分 类 ",""+ question '", "t answert 1") 
cur.execute (sql) 


conn.camuit () 
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# 关 闭 数 据 库 连 接 


conn.close() 
例 6-28 提取 docx 文 档 中 例题 .插图 和 表格 清单 。 
fram docx import Document 


import re 


result- ('li':[], 'fig':[], 'tab':[]) 
doc- Document (r'C:\ Python 可 以 这 样 学 .docx') 


for p in doc.paragraphs: # 饥 历 文档 所 有 段落 
t-p.text # 获 取 每 一 段 的 文本 
if re.match(' 例 \dt-\dt vv t): # 例 题 
result['li'].append(t) 
elif re.match ("E Nae - Nae", €): # 插 图 
result['fig'].append(t) 
elif re.match (VK Nat - Nae ', t): # 表 格 


result['tab'] append (t) 


for key in result.keys(): # 输 出 结果 
Print( '* 30) 
for value in result [key] : 
print (value) 
例 6-29 将 指定 文件 夹 中 的 文件 压缩 至 已 有 压缩 包 。 
可 能 会 有 朋友 问 , 为 什么 不 把 这 个 例子 和 下 面 的 例子 放 在 例 6-25 一 起 介绍 呢 ? 其 实 
我 是 故意 这 样 组 织 的 ,同类 知识 集中 讲解 和 分 散 介 绍 相 结合 ,学 起 来 就 不 会 太 累 ,更 容易 
加 深 记忆 。 就 像 书店 里 的 书籍 和 超市 里 商品 的 摆 放 位 置 集中 和 分 散 相 结合 一 样 , 也 类 似 
于 报纸 内 容 的 横 排 和 坚 排 相 结合 ,都 是 有 讲究 的 ,后 面 还 有 类 似 的 情况 。 什 么 也 别 说 了 ， 
我 们 一 起 看 代码 吧 ! 
fram zipfile import ZipFile 
fram os import listdir 
fram os.path import isfile, isdir, join 


def addFileIntoZipfile(srcDir, fp): 
for subpath in listdir (srcDir): 
subpath- join(srcDir, subpath) 


if isfile(subpath) : 

fp-write (subpath) FS ACT 
elif isdir(sutpath) : 

fp-write (subpath) # 写 入 文件 夹 


addFileIntoZipfile(subpath, fp) HAHH 
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Gef zipCoamress (srcbir, desZipfile): 
fp- ZipFile(desZipfile, mode- 'a') # 以 追加 模式 打开 或 创建 zip 文 件 
addFileIntoZipfile(srcDir, fp) 
fp.close() 


paths [r'C:\python35\ Scripts, r'C:\python35\Dlls', r'D:Vtc'] 
for path in paths: 
zipCampress (path, 'test.zip') 

例 6-30 使 用 密码 字典 暴力 破解 RAR 或 ZIP 文件 密码 。 

众所周知 ,使 用 字典 暴力 破解 的 成 功率 取决 于 密码 字典 文件 中 密码 是 否 足 够 多 。 如 
果 想 保证 非常 高 的 成 功率 ,可 以 参考 本 书 14. 2 节 中 介绍 的 MD5 破解 方法 来 生成 所 有 可 
能 的 密码 ,然后 再 逐个 尝试 。 另 外 ,如 果 下 面 的 代码 不 能 运行 ,需要 做 以 下 几 个 操作 : 
OO 到 http://www. rarlab. com/rar/ UnRARDLL. exe 下 载 并 安装 unrardll 库 , 然 后 根据 
需要 把 安装 文件 夹 中 的 UnRAR. dll 或 x64\UnRAR64. dll 文件 复制 到 unrar 安装 文件 夹 
(例如 ,C:\ Python 3. 5\Lib\site-packages\unrar) 中 ; @@ 打 开 unrar 安装 文件 夹 中 的 
unrarlib. py 文件 ,把 lib path-lib path or find library("unrar. dll") 直 接 改 为 unrarlib— 
ctypes. WinDLL(r"C:\Python 3. 5\Lib\site-packages\unrar\UnRAR64. dll") ,并 把 接 下 
来 的 两 行 代 码 删除 或 注释 掉 。 另 外 ,如 果 想 提高 破解 速度 ,可 以 参考 第 10 章 的 多 线程 编 
程 知识 稍微 改写 一 下 本 例 代码 。 


import os 
import sys 
import zipfile #zipfile 是 标准 库 
try: 
fram unrar import rarfile # 尝 试 导入 扩展 库 , 如 果 没 有 就 临时 安装 
except: 


path= '"'* os.path.dirname (sys .executable)V 
+ '\\scripts\ \pip" install - - upgrade pip" 
os.system (path) 
path= '""+ os.path.dirname (sys.executable)* "\\scripts\\pip" install unrar' 
os.system (path) 
fram unrar import rarfile 


def decryptRarZipFile (filename): 
if filename.endswith (' .zip'): 
fp- zipfile.ZipFile (filename) 
elif filename.endswith(' .rar") : 
fp- rarfile.RarFile (filename) 
desPath- £ilename[:- 4] # 解 压缩 的 目标 文件 夹 
if not os.path.exists (desPath) : 
os.nkdir (desPath) 
try: # 尝 试 不 用 密码 解压 缩 
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exoept: # 使 用 密码 字典 进行 暴力 破解 


fpPw open ('pwddict.txt') 
except: 
print (No dict file pwddict.txt in current directory. ') 
retum 
for pd in fpPwd: 
Pad- pad.rstrip() 
try: 
if filename.endswith(' .zip'): 
for file in fp.namelist(): # 重 新 编码 再 解码 ,避免 中 文 乱码 
fp.extract(file, path= desPath, pwd- pwd.encode () ) 
os.rename (desPatht '\\ '™+ file, 
desPatht '\ \ '+ file.enoocde ('op437" ) «decode ('dok")) 
print('Sucoess! ====> '+ pwd) 
fp.close() 
break 
elif filename.endswith('.rar'): 
fp.extractall(path- desPath, pude pwd) 


print('Sucoess! ====> '+ pwd) 
fp.close() 
break 
exoept: 
pass 
fpPwd.close () 
if nme  --' main ': 


if os.path.isfile (filename)and filename.endswith(('.zip', '.rar')): 
decryptRarZipFile (filename) 
else: 
print ('Must be RAR or ZIP file') 
例 6-31 {E Excel 2007* 文 件 中 的 多 个 同 结构 worksheet 中 的 内 容 合并 到 新 文件 中 
的 一 个 worksheet 中 。 
您 注意 : Excel 2007* 表示 Excel 2007 或 更 高 版 本 。 
感谢 中 国 石 油 大 学 (华东 ) 计 算 机 与 通信 工程 学 院 李 昕 老师 提供 本 例 的 问题 和 第 一 版 
代码 ,并 和 我 一 起 反复 修改 和 完善 得 到 了 最 终 版 本 的 代码 ,关于 基于 tkinter 的 GUI 编程 
知识 请 参考 本 书 第 15 章 。 
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inport os 
import sys 

fram tkinter import Tk, Button 
fram tkinter import simpledialog 


try: 
import openpyxl 
except: 
# 先 把 pip 升 级 到 最 新 版 本 
path= '"'+ os.path.dirname (sys.executable) V 
+ '\\scripts\ \pip" install - - upgrade pip" 
os.system (path) 
# 安 装 openpyxl 扩展 库 
path= '"'+ os.path.dirname (sys.executable)N 
+ '\\scripts\ \pip" install cpenpyxl " 
os.system (path) 
inport openpyxl 


def merge (start) : 
# 显 示 打 开 文 件 对 话 框 , 打 开 要 合并 的 Excel 2007 3c ff 
opts {'filetypes" : [ ("Excl 2007', '.xlsx')]} 
filename filedialog.askcpenfi lename (** opts) 
# 如 果 没 有 选择 文件 ,不 再 执行 后 面 的 代码 
if not filename: 
retum 
# 分 隔 路 径 和 文件 名 
filepath, tempfilename- os.path.split (filename) 
shotname- os.path.splitext (tempfi lename) [0] 
# 生 成 的 新 文件 名 
newFile- filepatht '\\ '+ shotname+ ' merge.xlsx' 
# 创 建新 的 Excel 2007 文 件 
workbook- openpyx] .Workbook() 
# 添 加 新 的 worksheet 
worksheet- workbook.worksheets [0] 
data= openpyxl.load workbook (filename) 
for sheetnum, sheet in enumerate (data .worksheets) : 
# 根 据 设 定 的 表 头 行 数 ,设置 读 取 的 起 始 行 
# 第 一 个 sheet 读 取 表 头 , 后 面 的 sheet 忽 略 表 头 


Bi EIC shest, 根 据 情 况 忽 略 表 头 
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for row in sheet.rows [rowStart:]: 
line- [col.value for col in row] 
worksheet .append (line) 
# 保 存 新 文件 
workbock.save (newFi le) 
# 打 开 刚 刚 创建 的 新 文件 
os.startfile (newFile) 


# 单 击 按钮 后 执行 的 函数 ,参数 a 表示 Excel 文件 中 每 个 worksheet 预期 表 头 行 数 
def callback() : 
kw- ('initialvalue':l, 'minvalue':0, 'maxvalue':10) 
headerum- simpledialog.askinteger(' 表 头 行 数 '，' 请 输入 表 头 行 数 ',x*kw) 
if headerNum !—None: 
merge (headerNum) 


root- Tk() 
root.title(" 合 并 sheet") 
Button(root, text= "合并 WorkSheets", bg= 'blue', bd 2, width- 28, command callback) .pack () 


root.mainloop() 


例 6-32 ”把 记事 本 文件 test. txt 转换 成 Excel 2007* 文件 。 假 设 test. txt 文件 中 第 一 行 
为 表 头 , 从 第 二 行 开始 是 实际 数据 ,并 且 表 头 和 数据 行 中 的 不 同 字段 信息 都 是 用 逗号 分 隔 。 
可 能 会 有 朋友 疑惑 这 样 的 代码 有 什么 意义 ,毕竟 使 用 Excel 打开 txt 文件 时 只 需要 
简单 单 击 几 下 鼠标 就 可 以 实现 数据 导入 。 是 的 ,确实 是 这 样 的 ,如 果 只 有 几 个 文件 是 完全 
可 以 手动 完成 的 ,但 是 如 果 有 几 百 、` 几 千 甚 至 更 多 的 文件 需要 转换 呢 ? 想象 一 下 ,我 们 写 
段 代 码 然后 一 边 喝 咖啡 一 边 看 着 程序 批量 处 理 大 量 的 文件 ,一杯 咖啡 还 没 喝 完 任务 就 
已 经 完成 了 , 那 该 是 多 么 的 懂 意 啊 ! 


fram openpyxl import Workbook 


def main (txtFileName): 
new XlsxFileName- txtFileName[:- 3]+ 'xlsx' 
Wo= Workbook () 
ws- wb.worksheets [0] 
with open(txtFileName)as fp: 
for line in fp: 
line line.strip() split (',') 
ws.append (line) 
wb.save(new XlsxFileName) 


main('test.txt!) 
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再 牛 的 程序 员 也 无 法 提前 预见 代码 运行 时 可 能 会 遇 到 的 所 有 情况 ,几乎 每 个 程序 员 
(也 包括 我 ,虽然 我 不 是 职业 程序 员 , 但 是 也 开发 过 不 少 系统 ) 都 被 用 户 说 过 “你 编 的 那个 
软件 不 好 用 啊 ”, 而 程序 员 经 过 反复 检查 以 后 发 现 问题 的 原因 是 用 户 操作 不 规范 或 者 输入 
了 错误 类 型 的 数据 ,于 是 一 边 修改 代码 加 强 类 型 检查 一 边 抱怨 用 户 为 什么 不 按 套路 出 牌 。 
其 实 呢 , 我 个 人 认为 这 样 的 问题 的 根源 还 是 在 程序 员 而 不 在 用 户 ,程序 员 编写 代码 时 有 义 
务 也 有 必要 考虑 这 些 特 殊 情况 ,因为 大 多 时 候 恰恰 是 一 些 特殊 情况 影响 了 整个 系统 的 美 
感 和 成 就 感 。 虽 然 软 件 在 发 布 前 一 般 都 经 过 了 充分 的 测试 ,然而 再 充分 的 测试 也 很 难 枚 
举 所 有 可 能 出 现 的 情况 ,这 时 候 异常 处 理 结构 则 是 避免 特殊 情况 下 软件 崩溃 的 利器 。 

每 种 高 级 编程 语言 都 提供 了 不 同形 式 的 异常 处 理 结构 ,大 幅度 提高 了 代码 的 健壮 性 。 
简单 地 说 ,异常 是 指 程序 运行 时 引发 的 错误 ,引发 错误 的 原因 有 很 多 ,例如 除 零 .下 标 越 
界 文件 不 存在 、 网 络 异常 等 。 如 果 这 些 错 误 得 不 到 正确 的 处 理 将 会 导致 程序 崩溃 并 终止 
运行 ,合理 地 使 用 异常 处 理 结构 可 以 使 得 程序 更 加 健壮 ,具有 更 高 的 容错 性 ,不 会 因为 用 
户 不 小 心 的 错误 输入 而 造成 程序 崩溃 ,也 可 以 使 用 异常 处 理 结构 为 用 户 提供 更 加 友好 的 
提示 。 有 效 的 软件 测试 方法 能 够 在 软件 发 布 之 前 发 现 尽 可 能 多 的 Bug, 而 软件 发 布 之 后 
再 出 现 错误 时 是 否 能 够 调试 程序 并 快速 定位 和 解决 存在 的 问题 则 是 程序 员 综 合 水 平和 能 
力 的 重要 体现 。 
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首先 ,异常 ”这 个 高 大 上 的 词语 所 描述 的 现象 实际 上 在 前 面 章节 的 代码 中 已 经 多 次 
出 现 了 ,只 是 没有 详细 解释 这 个 概念 ,让 我 们 一 起 回顾 一 下 : 


>>>2/0 # 除 0 错误 
Traceback (most recent call last): 
File "c pyshellé9» ", line 1, in «module» 
2/0 
ZeroDivisionError: division by zero 
>>> 'a'+2 # 操 作 数 类 型 不 支持 
Traceback (most recent call last): 
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File "<pyshell#10> ", line 1, in «module» 
'au2 
TypeError: Can't convert 'int' dbject to str implicitly 
>>>1{3, 4 5} * 3 # 操 作 数 类 型 不 支持 
Traceback most recent call last): 
File "<pyshell#11> ", line 1, in «module» 


G,45*3 
TypeError: unsupported operand type(s)for * : 'set' and "int" 
»»» print (testStr) # 变 量 名 不 存在 


Traceback (most. recent. call last): 
File "«pyshellf12» ", line 1, in < module» 
print (testStr) 
NemeError: name 'testStr' is not defined 
»»»fp-cpen(r'D:Vtest.data', 'rb') # 文 件 不 存在 
Traceback (most. recent. call last): 
File "«pyshellfl3» ", line 1, in < mxdule» 
fp- open (r'D:Ntest.data', 'rb') 
FileNotFoundError: [Ermo 2] No such file or directory: 'D: WW test.data" 
»»»lenG) # 人 参数 类 型 不 匹配 
Traceback (most. recent call last): 
File "«pyshellfl6» ", line 1, in < module» 
len(3) 
TypeError: object of type 'int' has no len() 
»»»list(3) # 人 参数 类 型 不 匹配 
Traceback (most. recent. call last): 
File "«pyshellfl17» ", line 1, in < module» 
list (3) 
TypeError: 'int' œject is not iterable 
通过 前 面 章节 的 学 习 , 大 家 应 该 已 经 注意 到 ,如 果 类 似 于 上 面 这 些 的 错误 得 不 到 正确 
的 处 理 将 会 导致 程序 崩溃 并 终止 运行 。 合 理 地 使 用 异常 处 理 结构 可 以 使 得 程序 更 加 健 
壮 ,具有 更 高 的 容错 性 ,不 会 因为 用 户 不 小 心 的 错误 输入 而 造成 程序 终止 ,也 可 以 使 用 异 
常 处 理 结构 为 用 户 提供 更 加 友好 的 提示 。 
异常 处 理 是 因为 程序 执行 过 程 中 出 钳 而 在 正常 控制 流 之 外 采取 的 行为 。 严 格 来 说 ， 
语法 错误 和 迎 辑 错误 不 属于 异常 ,但 有 些 语法 错误 往往 会 导致 异常 ,例如 ,由 于 大 小 写 拼 
写 错误 而 试图 访问 不 存在 的 对 象 , 或 者 试图 访问 不 存在 的 文件 ,等 等 。 当 Python 检测 到 
一 个 错误 时 ,解释 器 就 会 指出 当前 程序 流 已 无 法 继续 执行 下 去 ,这 时 候 就 出 现 了 异常 。 当 
程序 执行 过 程 中 出 现 错误 时 Python 会 自动 引发 异常 ,程序 员 也 可 以 通过 raise 语句 显 式 
地 引发 异常 。 
您 注意 : 尽管 异常 处 理 机 制 非常 重要 也 非常 有 效 , 但 是 不 建议 使 用 异常 来 代替 常规 
的 检查 ,例如 必要 的 if…else 判断 等 。 在 编程 时 应 避免 过 多 依赖 于 异常 处 理 机 制 来 提高 
程序 的 健壮 性 。 


254 外 Python 可 以 这 样 学 
T 


: 异常 和 错误 这 两 个 概念 并 不 完全 一 样 。 异 常 一 般 是 指 运行 时 由 于 某 些 
Pnie 一 般 是 直接 导致 程序 

世 渍 。 错 误 一 般 又 可 以 分 为 语法 错误 和 逻辑 错误 两 种 。 拼 写 错误 、 缩 进 不 一 致 .引号 或 括 
号 不 闭合 等 都 属于 语法 错误 ,一 般 来 说 存在 语法 错误 的 代码 是 无 法 运行 的 ,这 类 错误 很 容 
易 发 现 和 解决 ;而 存在 逻辑 错误 的 代码 通常 可 以 运行 ,只 是 非常 可 能 会 得 到 一 个 错误 的 结 
果 , 这 类 错误 非常 难 发 现 。 

PENEIRA: 为 哈 要 使 用 异常 处 理 结构 呢 ? 简单 地 说 ,可 以 理解 为 "请求 原谅 
比 请 求 允 许 要 容易 ”。 也 就 是 说 ,有 些 代码 执行 可 能 会 出 现 错误 ,也 可 能 不 会 出 现 错 误 ,这 
主要 由 运行 时 的 各 种 客观 因素 决定 ,此 时 建议 使 用 异常 处 理 结构 。 如 果 使 用 大 量 的 选择 
结构 来 提前 判断 , 仅 当 满足 相应 条 件 时 才 执 行 该 代码 ,这 些 条 件 判 断 可 能 会 严重 干扰 正常 
的 业务 逻辑 ,也 会 严重 降低 代码 的 可 读 性 。 


712 Phhm 内 置 异常 类 层次 结构 


下 面 全 面 展 示 了 Python 内 建 异 常 类 的 继承 层次 ,其 中 BaseException 是 所 有 内 置 异 
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*-- SyntaxError 
| — *--IndentationError 
I *-- TekError 
+ 一 - SystenError 

*-- TypeError 


*--SyntaxWarning 
+- - UserWarning 
+- - FutureWarning 
*-- InportWaming 
+- — UnicodsWaming 
+- — Bytesilaming 


73 常见 异常 处 理 结构 形式 


Python 提供 了 多 种 不 同形 式 的 异常 处 理 结构 ,基本 思路 都 是 一 致 的 : 先 尝试 运行 代 
码 , 然 后 处 理 可 能 发 生 的 错误 。 在 实际 使 用 时 ,可 以 根据 需要 来 选择 使 用 哪 一 种 。 


1. try:-except--- 


Python 异常 处 理 结构 中 最 基本 的 结构 是 try…except… 结 构 。 其 中 try 子 句 中 的 代 


256 Ó Python 可 以 这 样 学 


s 


码 块 包含 可 能 会 引发 异常 的 语句 ,而 except 子 句 用 来 捕捉 相应 的 异常 。 如 果 try 子 句 中 
的 代码 引发 异常 并 被 except 子 句 捕 提 , 则 执行 except 子 句 的 代码 块 ; 如 果 try 中 的 代码 
块 没有 出 现 异常 则 继续 往 下 执行 异常 处 理 结构 后 面 的 代码 ; 如果 出 现 异常 但 没有 被 
except 捕获 , 则 继续 往外 层 抛 出 ;如 果 所 有 层 都 没有 捕获 并 处 理 该 异常 , 则 程序 崩溃 并 将 
该 异常 呈现 给 最 终 用 户 ,这 是 我 们 最 不 希望 发 生 的 事情 。 该 结构 语法 如 下 : 


try: 
# 可 能 会 引发 异常 的 代码 , 先 执行 一 下 试 试 
except Exception[ as reason]: 
# 如 果 try 中 的 代码 抛 出 异常 并 被 excspt 捕捉 ,就 执行 这 里 的 代码 


例如 ,下 面 的 代码 用 来 接收 用 户 输 入 ,并 且 要 求 用 户 必须 输入 整数 ,而 不 接收 其 他 类 
型 的 输入 。 


>>>while True: 
x= input ('Please input:') 
try: 
x-int(x) 
print ('You have input (0)'.formet (x)) 
break 
except Exception as e: 
print ('Error. ') 
Please input:a 
Error. 
Please input:b 
Error. 
Please input:234c 
Error. 
Please input:5 
You have input 5 


AMER: 一 般 而 言 ,应 避免 捕捉 Python 异常 类 的 基 类 BaseException, 而 应 该 明 
确 指 定 捕捉 哪 种 蜡 常 ,然后 有 针对 性 地 编写 相应 的 处 理 代 码 。 

(QARAR: 回调 函数 原理 。6. 4. 1 节 介绍 shutil 模块 时 曾经 提 到 过 回调 函数 的 
概念 ,不 知道 大 家 有 没有 想 过 什么 是 回调 函数 ,回调 函数 又 是 怎么 实现 的 呢 ? 回调 函数 的 
定义 与 普通 函数 并 没有 本 质 的 区 别 , 但 一 般 不 直接 调用 ,而 是 作为 参数 传递 给 另 一 个 函 
数 , 当 另 一 个 函数 中 触发 了 某 个 事件 、 满 足 了 某 个 条 件 时 就 会 自动 调用 回调 函数 。 前 面 
例 6-23 介绍 了 如 何 删除 包含 只 读 属 性 文件 的 文件 夹 ,下 面 的 代码 实现 同样 的 功能 ,主要 
用 来 演示 回调 函数 的 原理 。 

inport os 

import stat 
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def remove readonly (func, path) : # 定 义 回 调 函数 
os.dmod(path, stat.S IWRITE) # 删 除 文件 的 只 读 属性 
func (path) # 再 次 调用 刚刚 失败 的 函数 


def del dir(path, onerror- None) : 
for file in os.listdir (path) : 
file or dir-os.path.join (path, file) 
if os.path.isdir(file or dir)and not os.path.islink(file or dir): 


del dir(file or dir) # 递 归 删 除 子 文件 夹 及 其 文件 
else: 
try: 
os.remove(file or dir) 尝试 删除 该 文件 
except: # 删 除 失 败 
if onerror and callable (onerror) : 
cnerror(os.remove, file or dir) 
# 自 动 调用 回调 函数 
else: 
print ('You have an exception but did not capture it.') 
os.mdir (path) ER C (ES 
del dir("E:\\old", remove readonly) # 调 用 函数 ,指定 回调 函数 


2. try…except…else… 


带 有 else 子 句 的 异常 处 理 结构 可 以 看 作 是 一 种 特殊 的 选择 结构 ,如 果 try 中 的 代码 
抛 出 了 异常 并 且 被 某 个 except 语句 捕 提 则 执行 相应 的 异常 处 理 代码 ,这 种 情况 下 就 不 会 
执行 else 中 的 代码 ;如 果 try 中 的 代码 没有 抛 出 异常 , 则 执行 else 块 的 代码 。 该 结构 的 语 
法 如 下 : 


try: 
# 可 能 会 引发 异常 的 代码 
except Exception [ as reason]: 
# 用 来 处 理 异 常 的 代码 
else: 
HIR try 子 句 中 的 代码 没有 引发 异常 ,就 继续 执行 这 里 的 代码 


例如 ,前 面 要 求 用 户 必 须 输入 整数 的 代码 也 可 以 这 样 写 : 


>>>while True: 
x= input ('Please input:') 
try: 
x-int(x) 
except Exception as e: 
print ('Error. ') 
else: 
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print ('You have input (0)'.formaet (x)) 
break 

Please input:a 

Error. 

Please input:b 

Error. 

Please input:888c 

Error. 

Please input:888 

You have input 888 


3. try--except--- finally- 


在 这 种 结构 中 ,无 论 try 中 的 代码 是 否 发 生 异 常 ,也 不 管 抛 出 的 异常 有 没有 被 except 


语句 捕获 ,finally 子 句 中 的 代码 总 是 会 得 到 执行 。 因 此 , finally 中 的 代码 常用 来 做 一 些 清 
理工 作 以 释放 try 子 句 中 申请 的 资源 。 该 结构 语法 为 


try: 
# 可 能 会 引发 异常 的 代码 
except Exception [ as reason]: 
# 处 理 异 常 的 代码 
finally: 
EXE try 子 句 中 的 代码 是 否 引发 异常 ,都 会 执行 这 里 的 代码 


例如 下 面 的 代码 ,不论 是 否 发 生 异 常 finally 子 句 中 的 代码 总 是 被 执行 。 


>>> def div(a, b): 
try: 
Print (a/b) 
except ZeroDivisionError: 
print ("Ihe second parameter cannot be 0.') 
finally: 
print(- 1) 
»»»div(, 5) 
0.6 
一 于 
»»»div(, 0) 
The second parameter cannot be 0. 
= 


您 注意 : 如 果 try 子 句 中 的 异常 没有 被 except 语句 捕捉 和 处 理 , 或 者 except 子 句 或 


else 子 句 中 的 代码 抛 出 了 异常 ,那么 这 些 异 常 将 会 在 finally 子 句 执行 完 后 再 次 抛 出 ， 
例如 : 


>>> def div(a, b): 
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try: 
print (a/b) 
except ZeroDivisiorError: 
print ("The second parameter cannot be 0. ') 
finally: 
print(- 1) 
>>>div('3', 5) 
LE 
Traceback (most. recent. call last): 
File "< pyshellf60» ", line 1, in «module» 
div('3', 5) 
File "«pyshellf59» ", line 3, in div 
print (a/b) 
TypeError: unsupported operand type(s)for /: 'str' and 'int" 


您 注意 : finally 子 句 中 的 代码 也 可 能 会 引发 异常 。 下 面 代码 的 本 意 是 使 用 异常 处 


理 结 构 来 避免 文件 对 象 没有 关闭 的 情况 发 生 , 但 是 由 于 指定 的 文件 不 存在 而 导致 打开 失 
败 , 结 果 在 finally 子 句 中 关闭 文件 时 引发 了 异常 。 


>>>try: 
fl= cpen('testl.txt', 'r') # 文 件 不 存在 , 抛 出 异常 ,不 会 创建 文件 对 象 f 
line fl.readline() # 后 面 的 代码 不 会 被 执行 
print (Line) 
exoept SyntaxError: # 这 个 except 并 不 能 捕捉 上 面 的 异常 
print ('Sth wrong ) 
finally: 
fl.close() #f1 不 存在 ,再 次 引发 异常 


Traceback (most recent call last): 
File "«pyshellf75» ", line 2, in «module» 
fl-open('testl.txt', 'r') 
FileNotFoundError: [Ermo 2] No such file or directory: 'testl.txt" 


During handling of the above exception, another exception occurred: 
Traceback (most. recent call last): 
File "«pyshell£75» ", line 8, in «module» 
fl.close() 
NameError: name 'fl' is not defined 


您 注意 : 如 果 在 函数 中 使 用 异常 处 理 结构 ,尽量 不 要 在 Finally 子 句 中 使 用 return 语 
名 ,以免 发 生 非 常 难以 发 现 的 逻辑 错误 。 例 如 下 面 的 代码 ,不 管 参数 是 否 符合 函数 要 求 ， 
调用 函数 时 都 得 到 了 同样 的 错误 信息 。 


>>>def div(a, b): 
try: 
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return a/b 
except ZeroDivisionError: 
return "Ihe second parameter cannot be 0." 
finally: 
return 'Error' 
»»»div(,5) 
gru 
»»»div('3', 5) 
D 
»»»div(G, 0) 
"Error! 


4. 可 以 捕捉 多 种 异常 的 异常 处 理 结构 


在 实际 开发 中 ,同一 段 代码 可 能 会 抛 出 多 种 异常 .并 且 需 要 针对 不 同 的 异常 类 型 进行 
相应 的 处 理 。 为 了 支持 多 种 异常 的 捕捉 和 处 理 ,Python 提供 了 带 有 多 个 except 的 异常 处 
理 结构 ,一旦 某 个 except 捕捉 到 了 异常 , 则 其 他 的 except 子 句 将 不 会 再 尝试 捕捉 异常 。 
该 结构 类 似 于 多 分 支 选择 结构 ,语法 格式 为 


try: 

# 可 能 会 引发 异常 的 代码 
except Excepticnl: 

# 处 理 异 常 类 型 1 的 代码 
except Exception?: 

# 处 理 异 常 类 型 2 的 代码 
except Exception3: 

# 处 理 异 常 类 型 3 的 代码 


下 面 的 代码 演示 了 这 种 异常 处 理 结构 的 用 法 ,连续 运行 3 次 并 输入 不 同 的 数据 ,结果 
如 下 : 


>>>try: 
x- float (input(" 请 输入 被 除数 : ')) 
y- float (input(" 请 输入 除数 : ')) 
zx/y 
except ZeroDivisionError: 
print (' 除 数 不 能 为 零 ) 
except TypeError: 
print ("被 除数 和 除数 应 为 数值 类 型 ') 
except NameError: 
print ("变量 不 存在 ') 
else: 
print(x, '/', y, '=", z) 
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请 输入 被 除数 : 30 # 第 一 次 运行 

请 输入 除数 : 5 

30.0 / 5.0- 6.0 

请 输入 被 除数 : 30 # 第 二 次 运行 , 略 去 重复 代码 
请 输入 除数 : abe 


Traceback (most recent call last): 
File "<pyshell#95> ", line 3, in «module» 
y- float (input(" 请 输入 除数 : ')) 
ValueError: could not convert string to float: 'abc' 


请 输入 被 除数 : 30 # 第 三 次 运行 , 略 去 重复 代码 
请 输入 除数 : 0 
除数 不 能 为 零 


在 实际 开发 中 ,有 时 候 可 能 会 为 几 种 不 同 的 异常 设计 相同 的 异常 处 理 代 码 (虽然 这 种 
情况 很 少 ) 。 为 了 减少 代码 量 , Python 允许 把 多 个 异常 类 型 放 到 一 个 元 组 中 ,然后 使 用 一 
个 except 子 句 同时 捕 提 多 种 异常 ,并 且 共 用 同一 段 异 常 处 理 代码 ,例如 : 


>>>try: 
x= float (input (' 请 输入 被 除数 : ')) 
y float (input(" 请 输入 除数 : ')) 
z-float(x)/ y 

exocept(ZeroDivisionError, TypeError, NameError): 
print ("捕捉 到 了 异常 ') 

else: 
print(x, '/', y, =", z) 


请 输入 被 除数 : 30 
请 输入 除数 : 0 
捕捉 到 了 异常 


5. 同时 包含 else F4 finally 子 句 和 多 个 except 子 句 的 异常 处 理 结构 


Python 异常 处 理 结构 中 可 以 同时 包含 多 个 except 子 句 、else FAJA finally F4, 
例如 : 


>>> def div(x, y): 

try: 
print(x / y) 

except ZeroDivisiorError: 
print ('ZeroDivisionError') 

except TypeError: 
print ("TypeError') 

else: 
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print('No Error") 
finally: 
print ("executing finally clause") 


»»»div(3,5) 

0.6 

No Error 

executing finally clause 

»»»div('3',5) 

TypeError 

executing finally clause 

»»»div(,0) 

ZeroDivisionError 

executing finally clause 

QARMA: 断言 语句 assert 也 是 一 种 比较 常用 的 技术 ,常用 来 在 程序 的 某 个 位 置 
确认 指定 条 件 必须 满足 , 常 和 异常 处 理 结构 一 起 使 用 。 断 言语 句 assert 仅 当 脚 本 的 __ 


debug__ 属 性 值 为 True 时 有 效 , 一 般 只 在 开发 和 测试 阶段 使 用 。 当 使 用 -O 选项 把 
Python 程序 编译 为 字 节 码 文件 时 ,assert 语句 将 被 删除 。 


»2»»83 
»»»b-5 
>>> assert a--b, 'amust be equal to b' 
Traceback (most. recent. call last): 
File "< pyshell#17> ", line 1, in < module» 
assert æ=b, 'amust be equal to b' 
AssertionError: a must be equal to b 
2»»try: 
assert a=b, 'amust be equal to b' 
except AssertionError as reason: 
print('$s:$s'$ (reason. class  . name  , reason)) 


AssertionError:a must be equal to b 


7.2 代码 测试 


代码 测试 不 仅 是 测试 团队 的 任务 ,更 是 开发 人 员 自己 的 义务 。 尽 管 错误 无 法 完全 
避免 ,一 个 优秀 的 程序 员 在 编写 代码 时 还 是 应 该 尽量 减少 代码 中 潜在 的 错误 (优秀 的 
程序 员 还 会 考虑 代码 的 易 测试 性 ) ,测试 人 员 一 旦 发 现 问题 一 定 要 经 过 反复 确认 之 后 
再 和 开发 人 员 沟通 , 并 且 双 方 要 注意 沟通 的 方式 和 语气 。 敢 于 质疑 不 代表 可 以 粗鲁 无 
礼 ,正如 哈佛 大 学 著名 心理 学 家 威廉 。 詹姆斯 所 说 :“ 思 考 可 以 随心 所 欲 , 表 达 想 法 则 
必须 谨慎 小 心 。? 毕 竟 每 个 人 都 爱面子 ,开发 人 员 不 希望 被 人 说 自己 写 的 代码 不 好 , 测 
试 人 员 也 不 希望 自己 的 努力 被 人 说 没 意 义 。 良 言 一 句 三 冬 暖 , 恶 语 伤 人 六 月 寒 。 必 须 
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要 “以 德 服 人 "(每 当 看 到 这 个 词 ,我 就 想起 来 电影 (方世玉 ) 中 的 雷 老虎 ) , 就事论事 , 干 
万 不 要 说 些 伤感 情 的 话 。 

@ 六 建议 :作为 一 个 小 建议 ,团队 成 员 之 间 进行 沟通 时 应 该 记 住 以 下 几 点 ; 四 言 之 有 
物 , 切 总 胡 捞 蛮 缠 、 无 理 取 阅 ,一 定 要 针对 核心 问题 进行 有 效 沟通 并 争取 尽快 达成 一 致 ， 
@ 适 当 赞美 保持 微笑 ,即使 确实 发 现 了 对 方 代码 或 思路 存在 问题 ,也 不 可 一 副 小 人 得 志 
的 样子 ,得 理 不 馈 人 ,要 善于 发 现 对 方 的 优点 和 可 取 之 处 ; 回 注意 场合 . 话 留 三 分 ,即使 和 
对 方 私交 非常 好 ,也 尽量 不 要 在 正式 场合 开 没有 分 寸 的 玩笑 ,要 考虑 其 他 人 的 感受 ; DE 
当 沉默 ,让 对 方 把 话说 完 , 切 不 可 随意 打 断 别人 的 话 ,一 定 要 让 对 方 清晰 、 完 整地 表达 完 自 
己 的 想法 之 后 再 进一步 沟通 。 
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Python 标准 库 doctest 可 以 搜索 程序 中 类 似 于 交互 式 Python 代码 的 文本 片段 ,并 
运行 这 些 交 互 式 代 码 来 验证 是 否 符 合 预期 结果 和 功能 ,常用 于 Python 程序 的 模块 
测试 。 

例 7-1 使 用 doctest 模块 测试 Python 代码 。 

下 面 的 代码 演示 了 doctest 模块 的 用 法 ,定义 了 一 个 函数 ,预期 功能 为 可 以 对 整数 或 
实数 相 加 ,或 连接 2 个 字符 串 、 列 表 、 元 素 , 或 对 两 个 集合 求 并 集 , 并 返回 结果 。 


def add(valuel, value2): 
# 下 面 三 个 单 引 号 之 间 是 测试 代码 ,doctest 会 搜索 这 些 代码 并 执行 
# 并 且 根 据 执行 结果 与 预期 结果 的 匹配 程度 来 测试 代码 是 否 正确 
' "retur the addition of two numbers or the concatenation of two string/list/ 
tuple 
»»»adiQ, 5) 
8 
»»»addi(3.0, 5.0) 
8.0 
»»»add([1,2], [3, 4]) 
[1, 2, 3, 4] 
»»»adi((,), (2, 3, 4) 
(, 2, 3, 4) 
»»»adi(, [3]) 
Traceback (most recent call last): 


TypeError: valuel and value? must be of the same type 
»»»adi(, '2') 
Traceback (most recent call last): 


TypeError: valuel and value? must be of the same type 
>>>ad([1], (2,)) 
Traccback (most recent call last): 
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TypeError: valuel and value? must be of the same type 
»»»adi('1224', [1,2,3,4]) 

Tracsback (most recent call last): 

TypeError: valuel and value? must be of the same type 
>>>ad({1,2,3}, (3,4,5)) 

{1, 2, 3, 4, 5} 

»»»adi((:1), {2:2}) 

Traceback (most. recent call last): 


TypeError: valuel and value2 must be the type of int,float,str,list,tuple 
or set 


# 下 面 是 正式 的 功能 代码 
if type(valuel)not in(int, float, str, list, tuple, set): 
raise TypeError ('valuel and value? must be the type of int,float,str, 
list,tuple or set') 
if type (valuel) !- type (value?) : 
raise TypeError ('valuel and value2 mist be of the same type') 
if type(valuel)-- set: 
return valuel | value2 


doctest.testmod () 
print (add 3,5) 


把 上 面 的 代码 保存 成 Python 程序 文件 doctest demo. py. fE IDLE 中 直接 运行 ,如 果 
函数 功能 完全 符合 预期 的 功能 要 求 就 会 输出 正确 的 结果 ,如 果 有 不 符合 预期 结果 的 代码 
就 会 给 出 相应 的 提示 。 在 命令 提示 符 环境 中 使 用 带 -v 参数 的 方式 执行 ,可 以 看 到 详细 的 
测试 过 程 ,如 图 7-1 Bron. 
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软件 测试 对 于 保证 软件 质量 非常 重要 ,尤其 是 升级 过 程 中 对 代码 的 改动 不 应 该 影响 
系统 的 原 有 功能 ,是 未 来 重 构 代码 的 信心 保证 。 一 般 来 说 稍微 有 些 规模 的 软件 公司 部 有 
专门 的 测试 团队 来 保证 软件 质量 ,但 作为 程序 员 ,首先 应 该 保证 自己 编写 的 代码 准确 无 误 
地 实现 了 预定 功能 。 

软件 测试 方法 有 很 多 ,从 软件 工程 角度 来 讲 ,可 以 分 为 白 盒 测试 和 黑 盒 测试 两 大 类 。 
其 中 , 白 盒 测 试 主要 通过 阅读 程序 源 代码 来 判断 是 否 符合 功能 要 求 , 对 于 复杂 的 业务 逻辑 


rying: 
add(3, 5> 

pecting: 

8 


Tying: 
add<3.0, 5.8) 
cting: 

8.8 


Fying: 

add(I1,21, [3, 41» 
pecting: 
Di, 2, 3, 41 


rying: 

add), Q, 3, 4» 
cting: 

4.2, 3, 人 


ing: 
addc, 131 
xpecting: 


rying: 
add<i, '2'» 
ting: 


图 7-1 


:Python 3.5>python doctest demo.py 


zNPython 3.5>python doctest demo.py [v] 


Traceback (most recent call last): 


TypeError: valuei and value2 must be of the same type| 
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doctest 测试 过 程 示意 图 


白 盒 测试 难度 非常 大 ,一 般 以 黑 盒 测 试 为 主 , 白 盒 测试 为 辅 。 黑 盒 测 试 不 关心 模块 的 内 部 
实现 方式 ,只 关心 其 功能 是 否 正确 ,通过 精心 设计 一 些 测试 用 例 来 检验 模块 的 输入 和 输出 


是 否 正确 ,最 终 判 断 其 是 否 符合 预定 的 功能 要 求 。 


单元 测试 是 保证 模块 质量 的 重要 手段 之 一 ,通过 单元 测试 来 管理 设计 好 的 测试 用 例 ， 
不 仅 可 以 避免 测试 过 程 中 人 工 反 复 输 入 可 能 引入 的 错误 ,还 可 以 重复 利用 设计 好 的 测试 
用 例 ,具有 很 好 的 可 扩展 性 ,大 幅度 缩短 代码 的 测试 时 间 。Python 标准 库 unittest 提供 
了 大 量 用 于 单元 测试 的 类 和 方法 ,其 中 最 常用 的 是 TestCase 类 ,其 常用 方法 如 表 7-1 


所 示 。 
表 7-1 TestCase 类 的 常用 方法 
方法 名 称 功能 说 明 方法 名 称 功能 说 明 
assertEqual(a，b) a==b assertNotEqual(a, b) al=b 


assertTrue(x) bool(x)is True assertFalse(x) bool(x)is False 
assertIs(a, b) ais b assertIsNot(a, b) a is not b 
assertIsNone(x) x is None assertIsNotNone(x) x is not None 
assertIn(a, b) ain b assertNotIn(a, b) a not in b 


assertIsInstance(a, b) 


isinstance(a, b) 


assertNotIsInstance(a, b) 


not isinstance(a, b) 
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s, 
续 表 
方法 名 称 功能 说 明 方法 名 称 功能 说 明 
b —b. ! 
assertAlmostEquel(a, b) | 29468 P5 D. — Leer ImostEquol(a, b) 2 Repi 
assertGreater(a, b) a>b assertGreaterEqual(a, b) a>=b 
assertLess(a, b) a<b assertLessEqual(a, b) a==b 
assertRegex(s, r) r. search(s) assertNotRegex(s, r) not r. search(s) 
setUpO 每 项 测试 开始 之 前 teat DownO: 每 项 测试 完成 之 后 
自动 调用 该 函数 自动 调用 该 函数 


其 中 ,setUp() 和 tearDown() 这 两 个 方法 比较 特殊 ,分 别 在 每 个 测试 之 前 和 之 后 自动 
调用 ,常用 来 执行 数据 库 连 接 的 创建 与 关闭 文件 的 打开 与 关闭 等 操作 ,避免 编写 过 多 的 
重复 代码 。 

例 7-2 编写 单元 测试 程序 。 

以 第 4 章 自 定 义 栈 的 代码 为 例 ,演示 如 何 利用 unittest EX} Stack X P AFR, Hi tR, 
变 大 小 以 及 满 / 空 测试 等 方法 进行 测试 ,并 将 测试 结果 写 人 文件 test Stack result. txt. 


# 要 测试 的 模块 ,在 本 书 第 4 章 
import Stack 
Python 单元 测试 标准 库 
import unittest 


class TestStack (unittest.TestCase) : 
def setUp(self): 
# 测 试 之 前 以 追加 模式 打开 指定 文件 
self.fp- open('D:\\test Stack result.txt', 'a*') 


def tearDown (self) : 
# 测 试 结束 后 关闭 文件 
self. 印 .close() 


def test isEnpty (self): 

try: 
s= Stack.Stack () 
# 确 保函 数 返 回 结果 为 True 
self.assertTrue (s.isEnpty ()) 
self.fp.write ('isEmpty passedn') 

except Exception as e: 
self.fp.write ('isEmpty failedn') 


def test. enpty (self): 
try: 
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于 Stack.Stack(5) 

for iin ['a', 'b', 'c']: 
s.push i) 

# 测 试 清空 栈 操作 是 否 工作 正常 

s.empty 

self.assertTrue (s. isEnpty ()) 

self.fp.write('empty passed n') 


except Exception as e: 


self.fp.write('empty failed") 


def test. isFull(self): 


try: 


s= Stack.Stack (3) 

s.pash (1) 

sapuh Q) 

s.push 3) 

self.assertTrue (s.isFull()) 
Self.fp.write('isFull passedWn') 


except Exception as e: 


self.fp.write ('isFull failed\n') 


def test pushpop (self): 


try: 


s= Stack.Stack () 
s.push(3) 

# 确 保 和 人 栈 后 立刻 出 栈 得 到 原来 的 元 素 
self.assertEqual (s.pop() , 3) 

s.push('a') 

self.assertEqual (3.pop(), 'a') 

self. 印 .write ('push and pop passed\n') 


except Exception as e: 


self.fp.write('push or pop failedWn') 


def test. setSize (self): 


try: 


s= Stack.Stack (8) 
fori in range(8): 

s.push(i) 
self.assertTrue (s. isFull ()) 
# 测 试 扩 大 栈 空间 是 否 正常 工作 
s.setSize(9) 
5.push (8) 
Self.assertTrue (s. isFull ()) 
Self.assertErual (s.pop(), 8) 
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# 测 试 缩小 栈 空间 是 否 正常 工作 

s.setSize(4) 

self.assertTrue (s.isFull()) 

self.assertEqual (s.pop() , 3) 

self.fp.write ('setSize passedn') 
except Exception as e: 

self.fp.write('setSize failedn') 


EEE: D 测 试用 例 的 设计 应 该 是 完备 的 ,应 保证 覆盖 尽 可 能 多 的 情况 ,尤其 是 要 
履 盖 边界 条 件 , 对 目标 模块 的 功能 进行 充分 测试 ,避免 漏 测 ; 四 测试 用 例 以 及 测试 代码 本 
身 也 可 能 会 存在 Bug, 通 过 测试 并 不 代表 目标 代码 没有 错误 ,但 是 一 般 而 言 , 不 能 通过 测 
试 的 模块 代码 是 存在 问题 的 ; @ 再 好 的 测试 方法 和 测试 用 例 也 无 法 保证 能 够 发 现 所 有 错 
误 , 只 能 通过 改进 和 综合 多 种 测试 方法 并 且 精 心 设计 测试 用 例 来 发 现 尽 可 能 多 的 潜在 问 
题 ; 图 除 了 功能 测试 ,还 应 对 程序 进行 性 能 测试 与 安全 性 测试 ,甚至 还 需要 进行 规范 性 测 
试 以 保证 代码 可 读 性 和 可 维护 性 。 

(QARR: 在 工程 界 ,不 管 是 安全 专家 还 是 恶意 攻击 者 ,最 常 使 用 的 漏洞 发 现 和 
挖 气 方 法 是 Fuzz, 属 于 “ 灰 ” 盒 测试 技术 ,也 可 以 说 是 一 种 特殊 的 黑 盒 测试 技术 。Fuzz 的 
主要 目的 是 crash、break 和 destroy, Fuzz 的 测试 用 例 往 往 是 带 有 攻击 性 的 畸形 数据 ,用 
来 触发 各 种 类 型 的 潜在 漏洞 。 

'O 拓展 知识 : 有 时 候 可 能 需要 把 代码 执行 过 程 中 的 一 些 调试 信息 、 出 错 信息 或 其 他 
信息 记录 下 来 而 不 影响 正常 的 输出 ,这 时 可 以 使 用 Python 标准 库 logging 提供 的 功能 。 
该 模块 提供 的 几 个 输出 方法 默认 把 信息 输出 到 标准 控制 台 sys. stderr, 可 以 修改 这 个 值 
使 得 信息 能 够 输出 到 文件 中 。 


import sys 

import logging 

old sys.stderr # 记 下 原 输出 目的 地 

fp-open('log test.txt', 'a') # 创 建 日 志文 件 

sys.stderr- fp # 把 信息 输出 到 指定 文件 
logging.debug ('Debugging information") # 和 输出 信息 到 文件 
logging.info('Informaticnal message") debug 0 fll info() 的 信息 一 般 会 被 忽略 


logging.warning ("Warning:config file ss not found', 'server.conf') 
logging.error ('Error occurred!) 
logging.critical('Critical error— shutting down') 


sys.stderr- old # 恢 复 标 准 控制 台 
fp.close() # 关 闭 文件 
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(QARAR: 软件 性 能 测试 。 在 本 书 2.4.1 节 、2.4.3 节 、3. 2.3 节 、5. 1.2 节 等 多 
个 章节 中 都 演示 过 使 用 Python 标准 库 time 提供 的 time() 函 数 来 测试 代码 运行 时 间 ,在 
5.1. 2 节 还 演示 过 timeit 模块 的 有 关 用 法 。 除 此 之 外 ,还 可 以 使 用 下 面 的 方法 来 测试 代 
码 的 运行 时 间 : 


class Timer (dbject) : 
def enter (self): 
Self.start- time () 

return self 


def exit (self, * args): 
self.end- time () 
Self.seconds- self.end- self.start 


def isPrime(n): 
ifn--2: 
return True 
for i in range (2, int (n**0.5)+ 2) : 
if n$i--0: 
return False 
return True 


with Timer ()as t: 
for i in range (1000) : 
isPrime (99999999999999999999999) 
print (t.seconds) 


运行 上 面 的 程序 ,会 输出 isPrimeO p& ZG fT 1000 次 所 需要 的 时 间 。 另 外 ,在 很 多 时 
候 , 除 了 要 测试 代码 运行 所 需要 的 时 间 ,还 需要 检测 代码 运行 过 程 中 的 内 存 占用 情况 ,这 
时 候 需 要 使 用 pip 安装 Python 扩展 库 memory_profiler, 然 后 编写 下 面 的 代码 : 


frm memory profiler import profile 


@ profile # 修 饰 器 
def isPrime(n): 
if n==2: 
retum True 
for i in range (2, int (nx*0.5)+2): 
if ni ==0: 
return False 
return True 
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isPrime (99999999999999999999999) 


运行 上 面 的 程序 ,会 得 到 下 面 的 输出 ,从 中 可 以 清楚 地 看 到 代码 对 内 存 的 使 用 情况 : 


3 33.9 MiB 0.0MiB  Gprofile 

4 def isPrime(n) 

5 33.9 MiB 0.0 MiB ifn--2: 

6 retum True 

7 33.9 MiB 0.0 MiB for iin range (2, int(r**0.5)* 2): 
8 33.9 MiB 0.0 MiB if n$i--0: 

9 33.9 MiB 0.0 MiB return False 

10 retum True 


7.3 代码 调试 


731 使 用 IDLE 调 斌 


当 程 序 运行 发 生 错误 或 者 得 到 了 非 预期 的 结果 时 ,是 否 能 够 熟练 地 对 程序 进行 调试 
并 快速 定位 和 解决 问题 是 体现 程序 员 综 合 能 力 的 重要 标准 之 一 。 

几乎 任何 一 种 集成 开发 环境 都 提供 了 代码 调试 功能 ,Python 标准 开发 环境 IDLE 也 
不 例外 。 使 用 IDLE 的 调试 功能 时 ,首先 单 击 IDLE 的 菜单 Debug Debugger 打开 调试 
器 窗口 ,然后 打开 并 运行 要 调试 的 程序 ,最 后 切换 到 调试 器 窗口 使 用 其 中 的 控制 按钮 进行 
调试 。 图 7-2 为 IDLE 调试 窗口 及 其 功能 简要 介绍 ,可 以 使 用 调试 按钮 对 程序 进行 单 步 


显示 所 有 ”显示 当前 执 
调试 按钮 “局 部 变量 ， 行 的 代码 


Debug Control DOR 
显示 当前 正在 调试 : 显示 所 有 全 部 变量 
的 文件 名 以 及 正在 ndLongestReuse. py:13: module?) 
执行 的 行 号 
bdb .run0，1line 387 exec cmd in globals, locals 
ain eiue», line 13: fro os path isport isfile as isfile 
当前 执行 行内 容 
局 部 变量 
= Globals 
builtins (module  builtin ' (built-in)? 
dec em $ 全 局 变量 


ame main 


—package_ None 


图 7-2 IDLE 调试 器 窗口 
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执行 ,实时 查看 变量 的 当前 值 并 跟踪 其 变化 过 程 , 对 于 理解 程序 内 部 的 工作 原理 和 发 现 程 
序 中 存在 的 问题 非常 有 帮助 。 

例 7-3 使 用 IDLE 调试 Python 程序 。 

假设 有 Python 程序 demo. py, 其 功能 为 生成 1000 个 随机 字符 (英语 字母 大 小 写 或 数 
,然后 查看 某 个 字符 的 出 现 次 数 ,代码 如 下 : 


3 


inport string 

fram randam import choice 

characters- string.ascii letters* string.digits 

selected [choice (characters) for i in range (1000)] 

che choice (selected) 

print(ch, ':', selected.count (ch) ) 

然后 使 用 IDLE 对 该 程序 进行 单 步调 试 (使 用 Step 按钮 ), 调 试 过 程 中 的 部 分 截图 如 
图 7-3 一 图 7-6 所 示 。 可 以 发 现 ,在 调试 过 程 中 执行 了 很 多 不 属于 demo. py 程序 的 代码 ， 
这 是 正常 的 ,因为 调用 标准 库 函 数 时 会 自动 进入 标准 库 并 执行 其 中 的 代码 。 如 果 不 想 进 
入 和 执行 标准 库 代码 ,可 以 使 用 Over 按钮 。 另 外 ,上 面 代 码 的 调试 过 程 显示 ,列表 推导 
式 在 本 质 上 还 是 循环 ,只 是 形式 比较 简单 而 已 。 


Iv Stack 厂 Source 
Go Step [over ou | ou 
F Locals [^ Globals 


demo .py5: «module» ( 


lbdb:rung, line 431: exec(cmd, globals, locals) 了 


Locals 
_builtins_ «module 'builtins’ (built-in)> 
—doc_ None 
le 'C/Python 3.5/demo.py' 
loader_ <class ' frozen importlib.BuiltinImporter'» 


ll ds 


characters 'abcdefghijkImnopqrstuvwxyz-.JKLMNOPQRSTUVWXYZ0123456789* 
choice «bound method Random.choice..ject at 0x0000000002E66F68 » »- 
string «module 'string' from 'CAV.on 3.NWibWWstring.py isi 


图 7-3 程序 调试 截图 (一 ) 


272 
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s 


e Eee ert ades [^ Source 
dadaa F Locals [^ Globals 


random.py:224: _randbelow0 


bdb'run() line 431: exec(cmd, globals, locals) 国 
main. “<module>0, line 5: selected = [choice(characters) for i in range(1000)] 


Locals. 
BuiltinMethod «class 'builtin function or method'» 
<class 'method'» 


[388 C 


Method 

int <class 'int'» 

maxsize 9007199254740992 

n 62 

self «random.Random object at Ox0000000002E66F68> 

type <class 'type'» 可 


图 7-4 程序 调试 截图 (二 ) 


Go| step | Over 加 区 ee Seer 
F Locals Globals 


random.py:231: randbelow() 


'bdb'.run0, line 431: exec(cmd, globals, locals) B 
' main '-«module» 0, line 5: selected = [choice(characters) for i 
<listcomp>0, line 5: selected = [choice(characters) for 


mem choice), line 253: i = self. randbelow(len(seq)) 


ind =i 
BuiltinMethod «class 'builin function or method'» n 
Method «class 'method'» 
getrandbits — «built-in method getrandbit..bject at 0x0000000002E66F68> 
it «dass ‘int'> 
k 6 
maxsize 9007199254740992 
n 62 
r 35 
Tai built-in method random of ..bject at 0x0000000002E66F68> 
EN «random.Random object at Ox0000000002E66F68> 
em «dass ype> 


图 7-5 程序 调试 截图 
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[bdb. -runQ, line 431: exec(cmd, globals, locals) 
'. «module» () line 5: selected = CMT forii 


Locals. 


i 37 


self «random.Random object at 0x0000000002E66F68> 
seq 'abcdefghijkImnopqrstuvwxyz..JKLMNOPQRSTUVWXYZ0123456789* 了 | 


图 7-6 程序 调试 截图 (四 ) 


732 使 用 pdb 调试 


pdb 是 Python 自 带 的 交互 式 源 代码 调试 模块 , 源 代码 文件 为 pdb. py, 感 兴趣 的 读者 
可 以 在 Python 安装 目录 下 找到 该 文件 进行 阅读 并 理解 其 工作 原理 。pdb 模块 提供 了 代 
人 码 调试 所 需要 的 绝 大 部 分 功能 ,包括 设置 /清除 (条 件 ) 断 点 、 启 用 /禁用 断 点 单 步 执行 、 查 
看 栈 帧 、 查 看 变量 值 、 查 看 当前 执行 位 置 、 列 出 源 代码 、 执 行 任意 Python 代码 或 表达 式 
等 。pdb 还 支持 事后 调试 ,可 在 程序 控制 下 被 调用 ,并 且 可 以 通过 pdb 和 cmd 接口 对 该 


调试 器 进行 扩展 。pdb 模块 常用 调试 命令 如 表 7-2 所 示 。 
表 7-2 常用 pdb 调试 命令 
简写 /完整 命令 用 法 示例 m E 
alrgs) 显示 当前 函数 中 的 参数 
b 173 在 173 行 设 置 断 点 
T 在 function 函数 第 一 条 可 执行 语句 位 置 设置 
b(reak) 断 点 


[Lfilename:]lineno | function 
[, condition]] 


不 带 参数 则 列 出 所 有 断 点 ,包括 每 个 断 点 的 触 
发 次 数 、 当 前 忽略 计数 以 及 与 之 关联 的 条 件 


b 175, condition 


设置 条 件 断 点 , 仅 当 condition 的 值 为 True 时 
该 断 点 有 效 


cl 


清除 所 有 断 点 


clCear) 
[ filename; lineno | bpnumber | cl file:line 


删除 指定 文件 中 指定 行 的 所 有 断 点 


[bpnumber …]] diss 


删除 第 3、5、9 个 断 点 
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Ej 
简写 /完整 命令 用 法 示例 解 E 

condition bpnumber condition 3 ab [US a<b 时 3 号 断 点 有 效 
condition] condition 3 将 3 号 断 点 设置 为 无 条 件 断 点 
continue 继续 运行 至 下 一 个 断 点 或 脚本 结束 
disable disable 35 禁用 第 3.5 个 断 点 ,禁用 后 断 点 仍 存在 ,可 以 再 
[bpnumber [bpnumber …]] 次 被 启用 
d(own) 在 栈 跟踪 器 中 向 下 移动 一 个 栈 帧 
dm [bpnumber …]] enden 启用 第 = 个 断 点 
h(elp)[command] 查看 pdb 帮助 

为 断 点 设置 忽略 计数 ,count 的 默认 值 为 0。 若 
ignore bpnumber [count] 某 断 点 的 忽略 计数 不 为 0, 则 每 次 触发 时 自动 

减 1, 当 忽略 计数 为 0 时 该 断 点 处 于 活动 状态 
jCump) j 20 跳 至 第 20 行 继续 运行 

1 列 出 脚本 清单 ,默认 11 行 

ICisO first [, last]] lm, n 列 出 从 第 m 行 到 第 n 之 间 的 脚本 代码 


列 出 从 第 m 行 开始 的 11 行 代码 


nCext) 


执行 下 一 条 语句 , 遇 到 函数 时 不 进入 其 内 部 


pCint) pi 打印 变量 i 的 值 

qCuit) 退出 pdb 调试 环境 

rCeturn) 一 直 运行 至 当前 函数 返回 

brek 设置 临时 断 点 ,该 类 型 断 点 只 被 中 断 一 次 ,触发 
后 该 断 点 自动 删除 

step 执行 下 一 条 语句 , 遇 到 函数 时 进入 其 内 部 

u(p) 在 栈 跟 踪 器 中 向 上 移动 一 个 栈 帧 

wChere) 查看 当前 栈 帧 


L!]statement 


在 pdb 中 执行 语句 , ! 与 要 执行 的 语句 之 间 不 需 
要 空格 ,任何 非 pdb 命令 都 被 解释 为 Python 语 
句 并 执行 ,甚至 可 以 调用 函数 或 修改 当前 上 下 
文中 变量 的 值 


直接 回 车 则 默认 执行 上 一 个 命令 


使 用 pdb 模块 调试 Python 代码 的 形式 常见 的 有 3 种 : 在 交互 模式 下 调试 特定 的 代 
码 块 ,在 程序 中 显 式 插入 断 点 ,把 pdb 作为 模块 来 调试 程序 。 

(1) 在 交互 模式 下 使 用 pdb 模块 提供 的 功能 可 以 直接 调试 语句 块 、 表 达 式 、 函 数 等 多 
种 脚本 ,常用 的 调试 方法 有 4 个 。 
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(D pdb. run(statement[, globals[. locals] D: 调试 指定 语句 ,可 选 参数 globals 和 
locals 用 来 指定 代码 执行 的 环境 ,默认 是 _main 模块 的 字典 。 

(2) pdb. runeval (expression[，globals[，locals]]): 返回 表达 式 的 值 ,可 选 参数 
globals 和 locals 的 含义 与 上 面 的 run() 函 数 一 样 。 

© pdb. runcall(function[ . argument. +J): 调试 指定 函数 。 

@ pdb. post. mortem([traceback D : 进入 指定 traceback 对 象 的 事后 调试 模式 ,如 果 
没有 指定 traceback 对 象 , 则 使 用 当前 正在 处 理 的 一 个 异常 。 

例如 ,下 面 的 代码 演示 了 如 何 调试 一 个 函数 ,其 中 “(Pdb)” 为 提示 符 , 在 后 面 输入 并 


执行 前 面 表 7-2 中 介绍 的 命令 即 可 。 


>>> inport pdb 
>>>def dem(): 
fram randam import randint 
x- [randint (1,10)for i in range (20)] 


me max (x) 


# 随 机 生成 20 个 介 于 1 10 的 整数 
# 最 大 数 


r- [index for index, value in enumerate (x)if value ==m] 


print (r) 


>>> pdb.runcall (demo) 
»«pyshellé13» (2)demo () 
(E)n 

»«pyshellé13» (3)demo () 
(E)n 

»«pyshellé13» (4) demo () 
(Edb)P x 


# 输 出 最 大 数 所 在 的 下 标 


# 调 试 函 数 


# 执 行 下 一 条 语句 


# 查 看 变量 值 


| 


(Eb)pm 

9** NameError: name 'm' is not defined 
(Pdo)n 

»«pyshell£l3» (5)demo() 

(Pdo)p m 

10 

(Pb)r 

[6, 15] 

- -Return-- 

><pyshell#13> (6)dem ()- > None 
(Pdo)l 

[EOF] 

(Pb)p r 

[6, 15] 

(Pb)pm 

10 

(Pb)q 


# 运 行 函数 直至 结束 


# 退 出 调试 模式 
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C2) 在 程序 中 嵌入 断 点 来 实现 调试 功能 。 

在 程序 中 首先 导入 pdb 模块 ,然后 使 用 pdb. set_trace() 在 需要 的 位 置 设置 断 点 。 如 
果 程 序 中 存在 通过 该 方法 调用 显 式 插入 的 断 点 ,那么 在 命令 提示 符 环 境 下 执行 该 程序 或 
双击 执行 程序 时 将 自动 进行 pdb 调试 模式 ,即使 该 程序 当前 不 处 于 调试 状态 。 例 如 ,下 
面 的 程序 IsPrime. py: 


import pdb 


n-37 
pdo.set trace() 
for i inrangeQ, n): 
if n$i--0: 
print (*No') 
break 
else: 
print ('Yes') 
由 于 使 用 pdb 设置 了 断 点 ES IDLE 中 运行 该 程序 时 会 自动 打开 调试 模式 ,如 图 7-7 
所 示 。 在 命令 提示 符 环境 中 运行 该 程序 时 也 会 自动 进入 pdb 调试 模式 ,如 图 7-8 所 示 。 


zz-—————----———------- RESTART: C:/Pytha 
> e: Wpython35Visprime. id nodule» ( 
Qut E in nee 


> es M prime. py (6) «aodule? () 
-> if mi == 


(Pdb 
Peg python5\iaprine. py (5) «module () C: \Python35>python IsPrime.py 
(ab) pi d aiia > c:\python35\isprime.py<5)<module><) 
| > for i in range(2,n? 
(Pab) Pdb? p i 
Pd «py (6) <nodule> () CIAM nane 'i' is not defined 
r - Pàb) n 

Pab 
Men Niharisprine. py (8) adi? O > c:Npython35 Nisprine .py<6)<module><> 
Plg in rangel > if nzi == 8: 
>: \pythondSisprine. py (6) <nodule> 0 a TRUE 
-> if ni 
(Pab) pi Pàb) 1 
Sao 1 inport pdb 

a 

(Pdb) 1 3 n232 

p e pH 4 pdb.set trace? 

3 nan 5 for i in rangeQ2,n2: 

i ETES g p iina 

E e ? printC'No') 

T rad No” ) 8 break 

: x bre 9 else: 

else: 18 printC Ves!) 
nU print (' Yes’) keora 
(Pab) Pdb? 
7-7 ”运行 程序 自动 进行 pdb 调试 模式 7-8 在 命令 提示 符 环境 运行 程序 


(3) 使 用 命令 行 调试 程序 。 

在 命令 行 提示 符 下 执行 "python -m pdb 脚本 文件 名 ”, 可 以 直接 进入 调试 环境 ,即使 
程序 中 并 没有 设置 任何 断 点 ,也 没有 使 用 pdb 的 任何 功能 ; 当 调 试 结束 或 程序 正常 结束 
以 后 ,pdb 将 重启 该 程序 。 例 如 ,把 上 面 的 程序 IsPrime. py 中 pdb 模块 的 导入 和 断 点 插 
入 函数 都 删除 ,然后 在 命令 提示 符 环境 中 使 用 调试 模式 运行 ,如 图 7-9 所 示 。 
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:Python35>python -m pdb IsPrine.py 
c: Npython35 Nisprine .pyC1)Cnodule>C> 
>n = 37 

Pdb) n 

c: Npython35 Nisprine .py(2)<module>(> 
> for i in rangeQ2,n): 

Pdb) w 

c: Npython35 NlibNbdb. pyC431)run C 

> exec(cnd, globals, locals) 
《string>C1)Kmodule>(》 
c:\python35\isprine .pyC2)Cnodule>C> 
> for i in range(2,n): 

Pdb) n 

c: Npython35 Nis prine .pyC3)Cnodule>C> 
> if nxi == 8: 

Pdb) p i 


Pdb) p n 
7 


Pdb) 


图 7-9 使 用 命令 行 调试 程序 


阶段 性 寄语 
P d i 


看 过 《 笑 傲 江湖 》 的 朋友 应 该 记得 ,华山 派 分 为 气 宗 和 剑 宗 的 事 本 来 令狐冲 以 及 其 他 
华山 气 宗 弟 子 是 不 知道 的 ,后 来 剑 宗 打上 门 来 并 且 重 创 气 宗 ,这 严重 打击 了 华山 弟子 的 自 
尊 心 和 信心 ,导致 气 宗 弟子 们 对 自己 练习 的 功夫 产生 了 怀疑 。 虽 然 随 着 小 说 情节 的 推进 ， 
我 们 最 终 知 道 岳 不 群 是 个 伪 君 子 并 且 很 部 视 他 ,但 他 在 华山 顶 上 对 弟子 们 分 析 气 宗 和 剑 
宗 的 一 段 话 还 是 非常 有 道理 的 ,大 概 意思 是 这 样 的 : 如 果 两 个 人 同时 学 习 武 术 , 其 中 一 个 
学 习 剑 宗 而 另 一 个 学 习气 宗 ,5 年 之 内 剑 宗 弟子 远 胜 气 宗 弟子 ,10 年 之 后 不 分 伯仲 ,15 年 
之 后 气 宗 弟子 远 胜 剑 宗 弟 子 。 内 功 的 修炼 就 是 这 样 的 ,修炼 越久 内 功 越 深 厚 , 功 夫 就 越 厉 害 
( 懂 武 术 的 朋友 不 要 抬杠 啊 , 咱 不 考虑 那些 练 错 甚至 走火 入 魔 的 情况 )。 本 书 前 7 章 可 以 看 
作 Python 内 功 ,各 位 读者 朋友 应 该 反复 修炼 ,必须 达到 “内 三 合 "和 “融会 贯通 ”的 境界 。 

看 到 这 里 读者 可 能 会 提出 疑问 ,令狐冲 后 来 没有 了 内 功 ,机 缘 巧 合 得 到 风 清 扬 传授 独 
孤 九 剑 , 仅 凭 剑 法 也 战胜 了 很 多 高 手 ,其 至 包括 江南 四 友和 魔 教 前 任教 主任 我 行 ,这 又 怎 
么 解释 呢 ? 如 果 有 这 样 的 疑问 那 说 明 你 看 书 或 者 电影 不 够 仔细 啊 。 令 狐 冲 和 江南 四 友 比 
试 时 ,向 问 天 先 忽悠 (据说 忽悠 的 英文 翻译 是 fool you) 江 南 四 友 说 不 许 使 用 内 功 ,而 令 狐 
冲 和 任 我 行 比试 时 ,江南 四 友 又 施展 激 将 法 反复 和 任 我 行 强调 只 比 剑 法 不 比 内 功 , 这 样 令 
狐 冲 才 取胜 的 。 如 果 允 许 使 用 内 功 ,在 绝对 的 实力 面前 ,任何 花哨 的 招式 都 是 虚妄 ,最 后 
任 我 行 只 是 大 声 喊 了 一 嗓子 就 把 令狐冲 和 江南 四 友 震 党 了 。 

当然 ,只 练 内 功 不 练 招式 也 是 不 行 的 ,再 强 的 内 功 也 必须 要 通过 一 定 的 外 在 形式 表现 
出 来 ,拳脚 也 好 ,器 械 也 罢 , 神 兵 利器 更 佳 。 对 于 Python 而 言 , 利 用 各 种 标准 库 和 扩展 库 
开发 各 领域 的 应 用 程序 就 是 表现 Python 内 功 的 重要 途径 和 形式 ,这 也 是 本 书 接 下 来 要 
重点 介绍 的 内 容 。 除 了 本 书 介绍 的 应 用 领域 之 外 ,Python 能 做 的 还 有 很 多 很 多 ,但 是 在 
一 本 书 里 展示 Python 的 所 有 应 用 领域 实在 是 不 现实 的 ,我 只 能 控制 住 体内 的 洪荒 之 力 ， 
也 给 读者 朋友 一 些 空间 去 慢 慢 挖 气 Python 的 强大 功能 。 

另外 ,在 阅读 后 面 章节 时 除了 Python 内 功 和 各 种 标准 库 与 扩展 库 , 你 还 需要 另 一 种 
内 功 , 那 就 是 相关 领域 的 专业 知识 。 


数据 库 应 用 开发 
s» 应 


毫 无 疑问 ,数据库 技术 的 发 展 为 各 行 各 业 都 带 来 了 很 大 的 方便 ,数据 库 不 仅 支持 各 类 
数据 的 长 期 保存 ,更 重要 的 是 支持 各 种 跨 平 台 、 跨 地 域 的 数据 查询 、 共 享 以 及 修改 , 极 大 方 
便 了 人 类 生活 和 工作 。 电 子 邮箱 .金融 行业 、 聊 天 系统 .各 类 网 站 、 办 公 自 动 化 系统 、 各 种 
管理 信息 系统 以 及 论坛 .社区 等 ,都 少不了 数据 库 技术 的 支持 。 另 外 , 近 些 年 来 大 数据 相 
关 技 术 的 流行 在 一 定 程度 上 也 促使 了 NoSQL 数据 库 的 快速 发 展 。 本 书 主要 介绍 
SQLite、Access、MySQL、MS SQL Server 等 几 种 关系 型 数据 库 的 Python 接口 ,并 通过 几 
个 示例 来 演示 数据 的 增删, 改 、 查 等 操作 。 最 后 以 MongoDB 为 例 介 绍 了 Python 对 
NoSQL 数据 库 的 访问 和 操作 。 虽 然 不 同 数据 库 系统 支持 的 SQL 语法 大 致 相同 ,但 还 是 
存在 一 定 的 差异 的 ,读者 可 以 根据 自己 使 用 的 数据 库 系统 查阅 相应 的 SQL 语法 。 


8.1 使 用 Python 操作 SQLite 数据 库 


SQLite AIRE Python 中 的 轻 量 级 、 基 于 磁盘 文件 的 数据 库 管理 系统 ,不 需要 安装 


数 SQL91 标准 ,支持 原子 的 一 致 的 ,独立 的 和 持久 的 事务 ,不 支持 外 键 限制 ;通过 数据 库 
级 的 独占 性 和 共享 锁定 来 实现 独立 事务 , 当 多 个 线程 同时 访问 同一 个 数据 库 并 试图 写 和 人 
数据 时 ,每 一 时 刻 只 有 一 个 线程 可 以 写 人 数据 。 

SQLite 支持 最 大 140TB 大 小 的 单个 数据 库 ,每 个 数据 库 完全 存储 在 单个 三 徘 文件 
中 ,以 B 十 树 数 据 结构 的 形式 存储 ,一 个 数据 库 就 是 一 个 文件 ,通过 直接 复制 数据 库 文件 
就 可 以 实现 数据 库 的 备份 。 如 果 需 要 使 用 可 视 化 管理 工具 ,可 以 下 载 并 使 用 
SQLiteManager, SQLite Database Browser 或 其 他 类 似 工具 。 

访问 和 操作 SQLite 数据 时 ,需要 首先 导入 sqlite3 模块 ,然后 创建 一 个 与 数据 库 关联 
的 Connection 对 象 , 例 如 : 

import sqlite3 # 导 入 模块 

conn- sqlite3.connect (exanple.db' ) # 连 接 数据 库 

成 功 创建 Connection 对 象 以 后 ,再 创建 一 个 Cursor 对 象 , 并 且 调 用 Cursor 对 象 的 
execute() 方 法 来 执行 SQL 语句 创建 数据 表 以 及 查询 、 插 人、 修改 或 删除 数据 库 中 的 数 
据 , 例 如 : 
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C conn.cursor () 
# 创 建 表 
C.execute('' 'CREATE TABIE stocks(date text, trans text, symbol text, qty real, price real)''') 
# 插 和 人 一 条 记录 
c.execute ("INSERT INTO stocks VALUES ('2016- 01- 05* , 'BUY' , 'REAT' ,100, 35.14) ") 
# 提 交 当 前 事务 ,保存 数据 
conn.camit () 
# 关 闭 数据 库 连接 
conn.close() 
如 果 需 要 查询 表 中 内 容 ,那么 重新 创建 Connection 对 象 和 Cursor 对 象 之 后 ,可 以 使 
用 下 面 的 代码 来 查询 。 
for row in c.execute('SELECT * FROM stocks ORDER BY price'") : 
print (row) 
接 下 来 重点 介绍 一 下 sqlite3 模块 中 的 Connection, Cursor, Row 等 对 象 。 
811 Comection 对 象 
Connection 是 sqlite3 模块 中 最 基本 也 是 最 重要 的 一 个 类 ,其 主要 方法 如 表 8-1 
所 示 。 
表 8-1 Connection 对 象 的 主要 方法 
5 法 说 M 
execute(sql[ ，parameters]) 执行 一 条 SQL 语句 
executemany(sql[ ，parameters]) 执行 多 条 SQL 语句 
cursor? 返回 连接 的 游标 
提交 当前 事务 , 如 果 不 提交 ,那么 自 上 次 调用 
commit() commit() 方 法 之 后 的 所 有 修改 都 不 会 真正 保存 到 
数据 库 中 
rollbackO 撤销 当前 事务 ,将 数据 库 恢 复 至 上 次 调用 commitO 
方法 后 的 状态 
close) 关闭 数据 库 连 接 
创建 可 在 SQL 语句 中 调用 的 函数 ,其 中 name 为 函 
create function(name, num params, func) 数 名 ,num_params 表示 该 函数 可 以 接收 的 参数 个 
数 ,func 表示 Python 可 调用 对 象 
Connection 对 象 的 其 他 几 个 函数 都 比较 容易 理解 ,下 面 的 代码 演示 了 如 何在 sqlite3 
连接 中 创建 并 调用 自 定义 函数 : 


inport sqlite3 
import hashlib 
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# 自 定义 函数 
def md5sum (t) : 
return hashlib.md5 (t) .hexdigest () 


# 在 内 存 中 创建 临时 数据 库 

conn- sqlite3.connect (":memory:") 

# 创 建 可 在 SQL 语句 中 调用 的 函数 

conn.create function ("md5", 1, mi5sum) 

Cur= conn.cursor () 

HE SQL 语句 中 调用 自 定义 函数 

cur.execute ("SELECT md5(?)"，[" 中 国 山东 烟台 ".encode()]) 
print (cur.fetchone () [0]) 
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游标 Cursor 也 是 sqlite3 模块 中 比较 重要 的 一 个 类 ,下 面 简单 介绍 一 下 Cursor 对 象 
的 常用 方法 。 


1. execute(sqlL ，parameters]) 


该 方法 用 于 执行 一 条 SQL 语句 ,下 面 的 代码 演示 了 用 法 ,以 及 为 SQL 语句 传递 参数 
的 两 种 方法 ,分 别 使 用 问号 和 命名 变量 作为 占 位 符 。 


import sqlite3 


conne sqlite3.connect (" :memory:") 

cur- conn.cursor () 

cur.execute ("CREATE TABLE people (name last, age)") 

who- "Dong" 

age- 38 

# 使 用 问号 作为 占 位 符 

cur.execute ("INSERT INIO people VALUES (? , ?)", (who, age)) 

# 使 用 命名 变量 作为 占 位 符 

cur.execute("SELECT * FROM Pecple WHERE name last- :who AND age- :age", 
{"who": who, "age": age)) 

print (cur.fetchone () ) 


运行 结果 如 图 8-1 所 示 。 
======================= RESTART: C:\Python 3.5\ 


图 8-1 运行 结果 (一 ) 


2. executemany(sql. seq of parameters) 


该 方法 用 来 对 于 所 有 给 定 参数 执行 同一 个 SQL 语句 ,参数 序列 可 以 使 用 不 同 的 方式 
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产生 ,例如 ,下 面 的 代码 使 用 和 迭代 来 产生 参数 序列 : 
import sqlite3 


# 自 定义 迭代 器 , 按 顺 序 生成 小 写字 母 
class IterChars: 
def init (self): 
self.count= ord('a') 
def iter (self): 
return self 
def next (self): 
if self.count» ord('z'): 
raise StopIteration 
self.cout +=1 
return (chr (self.count- 1),) 


cone sqlite3.connect (" :zmemory:") 

cur- conn.cursor () 

cur.execute ("CREATE TABIE characters (c) ") 

# 创 建 迭代 器 对 象 

theIter- IterChars () 

# 插 和 记录 ,每 次 插入 一 个 英文 小 写字 母 

Cur.executemany ("INSERT INIO characters (c) VALUES (? )", theIter) 
# 读 取 并 显示 所 有 记录 

cur.execute ("SELECT c FRM characters") 

print (cur.fetchall ()) 


下 面 的 代码 则 使 用 了 更 为 简洁 的 生成 器 来 产生 参数 : 


import sqlite3 
ámport string 


# 包 含 yield 语句 的 函数 可 以 用 来 创建 生成 器 对 象 
def char generator(): 
for c in string.ascii lowercase: 
yield(c,) 


conne sqlite3.connect (":memry:") 

cur- conn.cursor () 

cur.execute ("CREATE TABLE characters (c)") 

# 使 用 生成 器 对 象 得 到 参数 序列 

cur.executemany ("INSERT INTO characters (c)VALUES (? ) ", char. generator ()) 
cur.execute ("SELECT c FROM characters") 

print (cur.fetchall ()) 


下 面 的 代码 则 使 用 直接 创建 的 序列 作为 SQL 语句 的 参数 : 
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conn- sqlite3.connect (" zmemory:") 
# 创 建 表 
conn.execute ("CREATE TABLE person (firstname, lastname)") 
# 插 人 数据 
conn.executemany ("INSERT INTO person (firstname, lastname)VAIUES(?, ?)", persons) 
# 显 示 数 据 
for row in conn.execute ("SELECT firstname, lastname FROM person"): 
print (row) 
print("I just deleted", conn.execute ("DELETE FROM person") .rowoount, "rows") 


运行 结果 如 图 8-2 所 示 。 


RESTART: C:\Python £ 


ugo , 
('Calvin', 'Klein') 
I just deleted 2 rows 


图 8-2 运行 结果 (二 ) 


3. fetchone() fetchmany(size= cursor. arraysize) ,fetchall() 
这 3 个 方法 用 来 读 取 数 据 。 假 设 数据 库 通 过 下 面 的 代码 创建 并 插入 数据 : 
import sqlite3 


cone sqlite3.connect ("D:/addressBook.db") 

cur- conn.cursor () # 创 建 游 标 

car.execute (' ' "INSERT INTO addressList(name , sex , phon , QQ , address) VALUES 

CEbY', ct, '13888997011' , '66735' ， eRT) 

cur.execute ('''INSERT INTO addressList (name, sex, phon, QQ, address)VALUES('ZE3Hj ', "fc ', '15808066055 
"asm, RAH) 

cur.execute ('''INSERT INTO addressList (name, sex, phon, QQ, address) VALUES ('ZE E WE ', Br, ， 
15912108090", '3232099', 'Æ HT À) 

conn.camit () # 提 交 事 务 ,把 数据 写 人 数据 库 


conn.close () 
则 下 面 的 代码 演示 了 使 用 fetchall() 读 取 数 据 的 方法 : 
import sqlite3 


conn- sqlite3.connect ('D:/actiressBook.db' ) 


cur= conn.cursor () 
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cur.execute('SELECT * FROM adiressList') 
li-cur.fetchall () # 返 回 所 有 查询 结果 
for line in li: 
for item in line: 
print (item, end- ' ') 
print() 
conn.close() 


您 注意 : 相信 很 多 读者 有 MS SQL Server, MySQL. 或 其 他 数据 库 的 基础 ,在 编写 


SQL 语句 时 要 注意 ,大 多 数 SQL 语法 适用 于 多 种 类 型 的 关系 数据 库 , 但 不 同 数据 库 系统 
对 某 些 特定 操作 的 实现 还 是 略 有 不 同 的 。 因 此 ,如 果 某 个 按照 以 往 经 验 写 出 的 SQL 语句 
无 法 执行 或 者 结果 与 想象 的 不 一 样 , 可 能 需要 查阅 相关 资料 并 对 SQL 做 出 相应 的 修改 。 
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假设 数据 以 下 面 的 方式 创建 并 插入 数据 : 


conne sqlite3.connect ("D: NN test .db") 

c= conn.cursor () 

C.execute('' 'CREATE TABIE stocks (date text, trans text, symbol text, qty real, price real)''') 
c.execute ("""INSERT INTO stocks VALUES ('2016- 01- 05', 'BUY" , 'RHAT" ,100, 35.14) "") 

conn.ccrmit () 


c.close() 
那么 ,可 以 使 用 下 面 的 方式 来 读 取 其 中 数据 : 


conn.row factory- sqlite3.Row 
c= conn.cursor () 
c.execute('SELECT * FROM stocks') 
r-c.fetchone() 
print (type (z)) 
print (tuple (r)) 
print (r[2]) 
print (r.keys ()) 
print (r['qty']) 
for field in r: 
print (field) 


8.2 使 用 Python 操作 其 他 关系 型 数据 库 


除了 使 用 标准 库 sqlite3 操作 SQLite 数据 库 以 外 .Python 还 可 以 借助 于 功能 强大 的 
展 库 来 操作 Access, MS SQL Server, MySQL 等 多 种 类 型 的 数据 库 , 下 面 就 简单 介绍 其 


中 几 个 ， 
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821 操作 Acoess 数据 库 


需要 首先 安装 Python for Windows extensions. Hl Pywin32。 然 后 可 以 参考 下 面 的 
步骤 和 方式 来 访问 Access 数据 库 。 


1. 建立 数据 库 连接 


import win32com.client 

conn= win32cam.client.Di spatch (r 'ADODB.Connection') 

DSN= 'PROVITER- Microsoft.Jet.OLEDB.4.0;DATA SOURCE- C:/MyDB.mdb; ' 
conn.Open (DEN) 


2. 打开 记录 集 


rs- win32cam.client.Dispatch (r'ADODB.Recordset ' ) 
rs name- 'MyRecordset" # 表 名 
rs.Open('['* rs namet ']', conn, 1, 3) 


3. 操作 记录 集 


rs.AddNew() 
rs.Fields.Item(1).Value- 'data" 
rs.Update() 


4. 操作 数据 


conn= win32om.client.Dispatch (r' ADODB.Connection') 

DSN= 'PROVITER- Microsoft.Jet.OLETB. 4.0; DATA SOURCE- C: /MyLB.rdo; " 

sql statement- "INSERT INTO [Table Name]([Field 1], [Field 2])VALUES ('datal', 'data2')" 
conn. Open (DEN) 

conn.Execute(sql statement) 

conn.Close () 


5. 遍历 记录 


rs.MoveFirst() 
count- 0 
while 1: 
if rs.EOF: 
break 
else: 
count- countt 1 
rs.MoveNext () 


在 操作 Access 数据 库 时 ,如 果 一 个 记录 集 是 空 的 ,那么 将 指针 移 到 第 一 个 记录 将 导 
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致 一 个 错误 ,因为 此 时 RecordCount 是 无 效 的 。 解 决 的 方法 是 : 打开 一 个 记录 集 之 前 , 先 
将 Cursorlocation 设置 为 3, 然 后 再 打开 记录 集 ,此 时 RecordCount 将 是 有 效 的 。 


rs.Cursorlocation=3 
rs.Open('SEIECT * FROM [Table Name]', conn) # 确 保 cmn 处 于 打开 状态 
rs.RecordCount 


822 操作 MS SQL Sever 数据 库 


可 以 使 用 pywin32, pymssql 和 pyodbc 等 多 种 不 同 的 方式 来 访问 MS SQL Server 数 
据 库 。 

先 来 了 解 一 下 pywin32 模块 访问 MS SQL Server 数据 库 的 步骤 ,如 果 下 面 的 代码 不 
能 正常 执行 ,很 可 能 你 还 需要 使 用 命令 pip install adodbapi 安装 adodbapi 扩展 库 。 


1. 添加 引用 


inport adodbapi 
adbdbapi .adbdbapi .verbose- False #adds details to the semple printout 
import adodbapi.ado consts as adc 


2. 创建 连接 


Cfg- {'server' :'192.168.29.86\ \eclexpress' , 'password': nox! , 'db' : 'pscitemp!) 

constr- r"Provider- SQLOLETB.1; Initial Catalog- $s; Data Source- $s; user ID- $s; Password- $s; "$ (Cfg 
['do'], Cfg['server'], 'sa', Cfg['password']) 

conn= adodbapi .connect (constr) 


3. 执行 sql 语句 


cur- conn.cursor () 

sql= "SELECT * FROM softextBook WHERE title= '(0)' AND remark3!- ' (1)! ''' format (bookName, flag) 
cur.execute (sql) 

data= cur.fetchall () 


cur.close() 


4. 执行 存储 过 程 


# 假 设 proName 有 3 个 参数 ,最 后 一 个 参数 传 了 nn 
ret= cur.callproc ("procName', (parmi, parm2, None) ) 


conn.camuit () 


5. 关闭 连接 


conn-close() 
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接 下 来 再 通过 一 个 示例 来 简单 了 解 一 下 使 用 pymssql 模块 访问 MS SQL Server 数 
据 库 的 方法 ,如 果 下 面 的 代码 提示 无 法 导入 pymssql 模块 ,那么 你 很 可 能 需要 到 http:// 
www. lfd. uci. edu/ — gohlke/pythonlibs 下 载 与 已 安装 Python 版 本 对 应 的 pymssql 的 
whl 文件 ,然后 使 用 pip 命令 进行 安装 。 


inport pymssql 
database- 'mydatabase') 
cur- conn.cursor () 
cur.execute ('CREATE TABLE persons (id INT, name VARCHAR (100) ) ") 
cur.executemany ("INSERT INTO persons VALUES (d, xinos.king)", 
[(, 'John Doe"), (2, "Jane Doe')]) 

conn.cannit () 
cur.execute('SELECT * FROM persons WHERE salesrep- xinos.king', 'John Doe') 
row- cur.fetchone() 
while row: 

print("ID- $d, Name- xinos.king" $ (row[0], row[1])) 

row- cur.fetchone() 
cur.execute ("SELECT * FROM persons WHERE salesrep LIKE 'J$'") 


conn.close() 

最 后 让 我 们 一 起 看 看 如 何 使 用 pyodbc 扩展 库 读 取 MS SQL Server 2008 数据 库 中 的 
信息 ,如 果 下 面 的 代码 提示 无 法 导入 pyodbc, 请 登录 http://www. lfd. uci. edu/— 
gohlke/pythonlibs 下 载 相 应 的 whl 文件 之 后 再 安装 。 

import pyodoc 

S= 'TRIVER- (SQL Server);SERVER- .;DATABASE- Test;UID- sa;FWD- test. " 

conm= pyodoc.connect (s) 

cur- conn.cursor () 

cur.execute('SELECT * FROM yonghubiao') 

row- cur.fetchone () 

while row: 

print (row) 
row- cur.fetchone () 
conn.close() 


(QARAR: SQL 注入 式 攻击 与 防范 。 数 据 库 广 泛 应 用 于 各 种 场合 ,例如 论坛 、 电 
子 邮 箱 、 社 区 、 办 公 系统 、 银 行 . 证 券 . 游 戏 等 。 由 于 B/S 模式 的 Web 系统 安装 和 配置 简 
单 , 对 客户 端 要 求 低 , 所 以 得 到 了 越 来 越 广泛 的 应 用 。 在 开发 Web 应 用 时 ,一 定 要 注意 防 
范 SQL 注入 式 攻击 。 网 页 表单 接收 用 户 输入 之 后 把 用 户 输入 与 代码 中 的 SQL 语句 连接 
成 完整 的 SQL 语句 ,然后 再 提交 数据 库 执行 ,这 是 比较 常见 的 用 法 。 如 果 恶 意 用 户 精心 
构造 一 些 特殊 的 输入 从 而 产生 畸形 但 合法 的 SQL 语句 ,就 有 可 能 导致 SQL 注入 式 攻击 ， 
可 能 会 对 服务 器 造成 非常 大 的 伤害 , 轻 则 导致 私密 信息 泄露 , 重 则 严重 危害 服务 器 安全 。 
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bdqeieblpseplc dete Sab 注入 式 攻击 的 危险 ， 人 ia 户 的 输入 已 
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编写 发 展 成 为 一 门 艺术 ,当然 同时 也 研究 出 了 有 效 的 防范 措施 和 技术 。 关 于 SQL 注入 式 
攻击 更 加 详细 完整 的 内 容 请 查阅 有 关 资 料 , 这 里 只 举 个 简单 但 是 已 经 过 时 的 例子 。 例 如 ， 
用 户 登 录 页 面 的 SQL 语句 一 般 程序 员 会 写成 


sqllogin= "SELECT COUNT (id) FROM users WHERE userID- '"+ userNamet+ "' AND userPwd- '"+ userPasswordt "'™" 

如 果 用 户 按照 正常 操作 进行 输入 ,这 个 代码 是 没有 问题 的 ,但 是 如 果 用 户 输 入 任意 密 
码 ( 如 abc) 而 输入 admin' or 1 二 1 一 作为 用 户 名 (其 中 一 是 MS SQL Server 的 单行 注释 符 )， 
上 面 的 代码 就 变 成 了 

sqllogin= "SELECT COUNT (id) FROM users WHERE userID- 'admin' OR 1= 1- - AND userPwd= 'abc'" 


这 样 一 来 ,“--” 后 面 的 代码 将 不 被 执行 ,而 前 面 的 代码 中 因为 有 1 二 1 这 样 的 条 件 总 
是 成 立 , 所 以 可 能 在 不 知道 真实 密码 的 情况 下 以 任意 账号 身份 进行 登录 。 当 然 , 这 样 简单 
的 攻击 手段 早已 失效 ,大 家 就 不 要 尝试 了 。 
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Python 访问 MySQL 数据 库 可 以 使 用 MySQLDb 模块 ,该 模块 主要 方法 如 下 。 

(D commitO ; 提交 事务 。 

(2) rollbackO ; 回 滚 事务 。 

(3) callproc(self. procname. args): 用 来 执行 存储 过 程 ,接收 的 参数 为 存储 过 程 名 
和 参数 列表 ,返回 值 为 受 影响 的 行 数 。 

(4) execute(self, query. args): 执行 单条 SQL 语句 ,接收 的 参数 为 SQL 语句 本 身 
和 使 用 的 参数 列表 ,返回 值 为 受 影响 的 行 数 。 

(5) executemany(self, query, args): 执行 单条 SQL 语句 ,但 是 重复 执行 参数 列表 
里 的 参数 ,返回 值 为 受 影响 的 行 数 。 

(6) nextset(selD : 移 到 下 一 个 结果 集 。 

(7) fetchall(self) : 接收 全 部 的 返回 结果 行 。 

(8) fetchmany(self. size None) : 接收 size 条 返回 结果 行 ,如 果 size 的 值 大 于 返回 
的 结果 行 的 数量 , 则 会 返回 cursor. arraysize 条 数据 。 

(9) fetchone(self): 返回 一 条 结果 行 。 

(10) scrollCself. value. mode— 'relative? : 移动 指针 到 某 一 行 ,如 果 mode — 'relative'. 
则 表示 从 当前 所 在 行 移动 value 条 记录 ;如 果 mode=absolute', 则 表示 从 结果 集 的 第 一 行 
移动 value 条 记录 。 

使 用 该 模块 查询 MySQL 数据 库 记 录 的 方法 如 下 面 的 代码 所 演示 : 
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import MjSQLao 


conn- MySQLdb.connect (host= 'localhost',user- 'root' ,passwd- 'root', 
do- 'test',port= 3306) 
cur- conn.cursor () 
cur.execute('SELECT * FROM user!) 
cur.close() 
conn.close () 
except. MySQLGb.Error as e: 
print ("Mysql Error èd: $s" € (e.args[0], e.args[1])) 
插入 数据 的 用 法 如 下 面 的 代码 所 演示 : 
import MySULdo 
try: 
conn- MySQLdb. connect (host= 'localhost',user- 'root',passwd- 'root',port- 
3306) 
cur- conn.cursor () 
cur.execute ('CREATE DATABASE IF NOT EXISTS python!) 
conn.select db('python') 
Cur.execute ('CREATE TABIE test (id int,info varchar (20)) ') 
value [1, 'hi rollen'] 
cur.execute ('INSERT INIO test VAIJES ($s, $3) ', value) 
values- [] 
for i in range(20) : 
values.append((i, 'hi rollen'* str (i))) 
cur.executemany ('INSERT INTO test VALUES ($5,$3) ', values) 
cur.execute ('UPDATE test SET info- "I am rollen" WHERE id- 3') 
conn.camit () 
cur.close() 
conn.close() 
except MySQLdb.Error as e: 
print ("MySQL Error $d: $s" $% (e.args[0], e.args[1])) 


8.3 操作 MongoDB 数据 库 


一 项 权威 调查 显示 ,在 大 数据 时 代 软 件 开发 人 员 必 备 的 十 项 技能 中 MongoDB 数据 
库 名 列 第 二 , 仅 次 于 HTML5。MongoDB 是 一 个 基于 分 布 式 文件 存储 的 文档 数据 库 ,可 
以 说 是 非 关 系 型 (Not Only SQL,NoSQL) 数 据 库 中 比较 像 关 系 型 数据 库 的 一 个 ,具有 免 
3 .操作 简单 .面向 文档 存储 自动 分 片 .可 扩展 性 强 .查询 功能 强大 等 特点 ,对 大 数据 处 理 
支持 较 好 , 旨 在 为 Web 应 用 提供 可 扩展 的 高 性 能 数据 存储 解决 方案 。MongoDB 将 数据 
存储 为 一 个 文档 ,数据 结构 由 键 值 (key>value) 对 组 成 。MongoDB 文档 类 似 于 JSON 对 
象 。 字段 值 可 以 包含 其 他 文档 数组 及 文档 数组 。 
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MongoDB 数据 库 可 以 到 官方 网 站 https: //www. mongodb. org/downloads F £k . & 
装 之 后 打开 命令 提示 符 环境 并 切换 到 MongoDB 安装 目录 中 的 server V3. 2Vbin 文件 夹 ， 
然后 执行 命令 mongod —dbpath D: \ data —journal —storageEngine = mmapvl 启动 
MongoDB, 当然 需要 首先 在 D 盘 新 建文 件 夹 data, 让 刚才 那个 命令 提示 符 环境 始终 处 于 
运行 状态 ,然后 再 打开 一 个 命令 提示 符 环境 .执行 mongo 命令 连接 MongoDB 数据 库 , 如 
果 连 接 成 功 的 话 , 会 显示 一 个 “二 ”符号 作为 提示 符 ,之 后 就 可 以 输入 MongoDB 命令 了 ， 
例如 ,下 面 的 命令 可 以 打开 或 创建 数据 库 students: 


> use students 
下 面 的 命令 用 来 在 数据 库 中 插入 数据 : 


> zhangsan- ('name':'Zhangsan', 'age':18, 'sex':'male') 
> do.students.insert (zhangsan) 

> lisi= ('name':'Lisi', 'age':19, 'sex':'male'] 

> do.students.insert (lisi) 


下 面 的 命令 用 来 查询 数据 库 中 的 记录 : 

> do.students.find() 

下 面 的 命令 用 来 查看 系统 中 所 有 数据 库 名称 : 

> show dbs 

其 他 更 多 MongoDB 命令 请 读者 查阅 相关 资料 。 另 外 ,Python 扩展 库 pymongo 完美 
支持 MongoDB 数据 的 操作 ,可 以 使 用 pip 命令 进行 安装 。 下 面 的 代码 演示 了 pymongo 
操作 MongoDB 数据 库 的 一 部 分 用 法 ,算是 抛砖引玉 吧 ,更 多 的 用 法 可 以 使 用 学 习 Python 
的 利器 dir() 和 help() 来 获得 ,或 者 查阅 MongoDB 官方 文档 。 


>>> import pymongo # 导 入 模块 
>>> client= pympngo.Mbngoclient ('localhost', 27017) 

# 连 接 数据 库 ,27017 是 默认 端口 
>>> db- client.students # 获 取 数 据 库 
»»»db.collection names() # 查 看 数据 集合 名 称 列表 
['students', 'system.indexes'] 
>> > students- db.students # 获 取 数据 集合 


»»»students.firnd() 
< pyrongo.cursor.Cursor dbject at 0x00000000030934A8» 


>>> for item in students.find(): # 遍 历数 据 
print (item) 

('age': 18.0, 'sex': "male', ' id': dbjectId('5722dbcfeadfib?954a5923" ) , 

"name: 'Zhangsan'} 


('age': 19.0, 'sex': 'male', ' id': QbjectId('57220c6eeadfr?99b4a52e24') , 
"name': 'Lisi'} 


»»» wanguu- (nane! : 'Wangau!, 'age':20, 'sex':'male'] 
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>>> students.insert (wangwu) # 插 入 一 条 记录 
QjectId (57231373485£3d1804b5£4oc" ) 
>>> for item in students. find(('name' : 'Wangwu" ]) : # 指 定 查询 条 件 
print (item) 
('age': 20, * id': dbjectId('57231373465£3d1804b5£4cc"), 'sex': 'male', 'name': "Wangwu'] 
>>> students.find one() # 获 取 一 条 记录 


('age': 18.0, 'sex': 'male', ' id': GbjectId('"5722Gbcfeadfb295b4a52s23') 'name': 'Zhangsan'] 
>>> students.find one(('name': 'Wangwu']) 
('age': 20, ' id': ObjectId('57231373485£3d1804b5f4cc'), 'sex': 'male', 'name': 'Wangwu'] 


>>> students. find() .count () # 记 录 总 数 
3 
>>> students.remove ({'name" : 'Wangwu' }) # 删 除 一 条 记录 


C wr 
>>> for item in students.find(): 
print (item) 
{'name": 'Zhangsan', '_id': ObjectId('5722cbcfeadfb295b4a52e23'), 'sex': "male', 'age': 18.0} 
('name': 'Lisi', ' id': GbjectId(!5722oc6ecadfb?95b4852e24") , 'sex': 'male', 'age': 19.0} 
>>> students. find() .count () 
2 
>>> students.create index([("name', pymongo.ASCENDING)]) # 创 建 索引 
"mme 1' 
>>> students.update ({'name" : Zhangsan! ), ('$ set' : ('age' :25))) # 更 新 数据 库 
('rModified': 1, 'ok': 1, 'updatedExisting': True, "n': 1) 


>>> students.update (('age' :25}, ('$ set' : ("sex : 'Female')]) # 更 新 数据 库 
('rModified': 1, 'ok': 1, 'updatedExisting': True, "n': 1) 

>>> students.remove () # 清 空 数据 库 
deti 6982 

>>> students. find() .count () 


2» »Wangwu- ('name':'Wangwu', 'age':22, 'sex':'Female'] 

>>> students.insert many([Zhangsan, Lisi, Wangwu]) # 插 人 多 条 数据 

< pyrongo. results.InsertMenyResult cbject at 0x0000000003762750> 

>>> for item in students.find().sort('name',pymongo.ASCENDING): ”# 对 查询 结果 排序 


print (item) 
{"name': "Lisi', ' : GojectId('57240d3f4&bf3dll8oe*bbe4'), 'sex': 'Male', 'age': 21} 
('name': "Wangwu', ' id': ObjectId('5724003£46b£3dll8oe*kbe5'), 'sex': 'Female', 'age': 22) 
('name': "Zhangsan', ' id': QbjectId('5724033£465£3dl180e5Hbe3'), 'sex': 'Male', 'age': 20) 
>>> for item in students. find() .sort ([ ('sex', pymongo. DESCENDING) , 


("name' ,pymongo. ASCENDING) ]) : 


print (item) 
(name': "Lisi', ' id': dbjectId('5724083£46b£3dll8oe*kbe4'), 'sex': "Male', 'age': 21] 


Unane': 'Zhangsan', ' id': QbjectId('5724033£4685f£3dll80eSbbe3'), 'sex': 'Male', 'age': 20} 
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Uname': Wangwu', ' id': QbjectId('57240d3f4Gbf£3dll8oe*hbe5'), 'sex': 'Female', 'age': 22} 


网 络 应 用 开发 
s» 应 


Socket 是 计算 机 之 间 进 行 网 络 通信 的 一 套 程 序 接口 ,最 初 由 Berkeley 大 学 研发 , 目 
前 已 经 成 为 网 络 编程 的 标准 ,可 以 实现 跨 平 台 的 数据 传输 。Socket 相当 于 在 发 送 端 和 接 
收 英之 间 建 立 了 一 个 管道 来 实现 数据 和 命令 的 相互 传递 。Python 标准 库 socket 对 
Socket 进行 了 封装 ,支持 Socket 接口 的 访问 ,大 幅度 简化 了 程序 的 开发 步骤 ,提高 了 开发 
效率 。 除 此 之 外 ,Python 还 提供 了 urllib 等 大 量 模块 可 以 对 网 页 内 容 进行 读 取 和 处 理 ， 
在 此 基础 上 结合 多 线程 编程 以 及 其 他 有 关 模 块 可 以 快速 开发 网 页 息 虫 之 类 的 应 用 。 可 以 
使 用 Python 语言 编写 CGI 程序 ,也 可 以 把 Python 代码 肉 入 到 网 页 中 运行 ,而 借助 于 
web2py .django, Flask 或 其 他 框架 , 则 可 以 快速 开发 网 站 应 用 。 


9.1 计算 机 网 络 基 础 知识 


为 了 更 好 地 理解 本 章 后 面 的 内 容 ,首先 简要 介绍 一 下 计算 机 网 络 的 基本 概念 ,如 果 读 
者 确实 对 网 络 编程 感 兴趣 可 以 参考 (计算 机 网 络 》《 网 络 应 用 开发 实践 )《 网 站 设计 与 开 
发 ) 之 类 的 书籍 了 解 更 详细 的 知识 。 


1. 网 络 体系 结构 


目前 较为 主流 的 网 络 体系 结构 是 ISO/OSI 参考 模型 和 TCP/IP 协议 族 。 这 两 种 体 
系 结构 都 采用 了 分 层 设计 和 实现 的 方式 .ISO/VOSI 参考 模型 从 上 而 下 划分 为 应 用 层 、 表 
示 层 、 会 话 层 、 传 输 层 、 网 络 层 .数据 链 路 层 和 物理 层 , 而 TCP/IP 则 将 网 络 划分 为 应 用 层 、 
传输 层 、 网 络 层 和 链 路 层 。 分 层 设计 的 好 处 是 ,各 层 可 以 独立 设计 和 实现 ,只 要 保证 相 邻 
层 之 间 的 调用 规范 和 接口 不 变 , 就 可 以 方便 .灵活 地 改变 各 层 的 内 部 实现 以 进行 优化 或 完 
成 其 他 需求 。 


2. 网 络 协议 


网 络 协议 是 计算 机 网 络 中 为 了 进行 数据 交换 而 建立 的 规则 、 标 准 或 约定 的 集合 , 语 
法 、 语 义 和 时 序 是 网 络 协议 的 三 要 素 。 简 单 地 讲 . 可 以 这 么 理解 ,语义 表示 要 做 什么 ,语法 
表示 要 怎么 做 ,时 序 规定 了 各 种 事件 出 现 的 顺序 。 语 法 和 语义 相对 来 说 比较 容易 理解 ,可 
能 有 读者 在 想 为 啥 要 严格 规定 各 类 事件 的 时 间 和 顺序 。 试 想 ,假设 早上 8 点 A 和 也 两 个 
同事 上 班 时 在 公司 门口 偶遇 .A 问 B*nz f 37. B 没 做 任何 回答 就 走 了 (如 何 计算 A 的 心 
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理 阴 影 面积 ) ,中 午 12 点 下 班 时 两 人 在 公司 门口 再 次 偶遇 ,B 对 A 说“ 吃 了 ”, 我 们 可 以 想 
象 到 A 看 B 的 眼神 会 是 什么 样 的 。 

(1) 语法 : 语法 规定 了 用 户 数 据 与 控制 信息 的 结构 与 格式 。 

(2) 语义 : 语义 用 来 解释 控制 信息 每 个 部 分 的 含义 ,规定 了 需要 发 出 何 种 控制 信息 ， 
以 及 需要 完成 的 动作 和 做 出 什么 样 的 响应 。 

(3) 时 序 : 时 序 是 对 事件 发 生 顺 序 的 详细 说 明 , 也 可 称 为 “同步 ”。 


3. 应 用 层 协 议 


应 用 层 协 议 直 接 与 最 终 用 户 进 行 交互 ,用 来 确定 运行 在 不 同 终 端 系 统 上 的 应 用 进程 
之 间 如 何 传递 报 文 。 下 面 简单 列 出 了 几 种 常见 的 应 用 层 协议 。 

(1) DNS: 域名 系统 (Domain Name System) ,用 来 实现 域名 与 IP 地 址 的 转换 ,运行 
于 UDP 之 上 ,默认 使 用 53 号 端口 。 

(2) FTP: 文件 传输 协议 (File Transfer Protocol) ,可 以 通过 网 络 在 不 同 平台 之 间 实 
现 文件 的 传输 ,是 一 种 基于 TCP 的 明文 传输 协议 ,默认 工作 在 21 号 端口 。 

(3) HTTP: 超 文本 传输 协议 (HyperText Transfer Protocol) ,运行 于 TCP 之 上 , 默 
认 使 用 80 号 端口 。 

(4) SMTP: 简单 邮件 传输 协议 (Simple Mail Transfer Protocol) ,建立 在 TCP 的 基 
础 上 ,使 用 明文 传递 邮件 和 发 送 命令 ,默认 使 用 25 号 端口 。 

(5) TELNET: 远程 登录 协议 ,运行 于 TCP 之 上 ,默认 使 用 23 号 端口 。 


4. 传输 层 协议 


在 传输 层 主要 运行 着 传输 控制 协议 (Transmission Control Protocol,TCP) 和 用 户 数 
据 报 协议 (User Datagram Protocol,UDP) 两 个 协议 ,其 中 TCP 是 面向 连接 的 ,具有 质量 
保证 的 可 靠 传输 协议 ,但 开销 较 大 ;UDP 是 尽 最 大 能 力 传 输 的 无 连接 协议 ,开销 小 ,常用 
于 视频 在 线 点 播 (Video On Demand,VOD) 之 类 的 应 用 。TCP 和 UDP 本 身 并 没有 优 劣 
之 分 ,仅仅 是 适用 场合 有 所 不 同 。 在 传输 层 , 使 用 端口 号 来 标识 和 区 分 同一 台 计算 机 上 和 运 


行 的 多 个 应 用 层 进程 ,每 当 创建 一 个 应 用 层 网 络 进程 时 系统 就 会 自动 分 配 一 个 端口 号 与 
之 关联 ,是 实现 网 络 上 端 到 端 通信 的 重要 基础 。 例 如 ,MS SQL Server 默认 占用 1433 端 
口 ,远程 桌面 连接 默认 占用 3389 端口 , HTTP 默认 使 用 80 端口 ,MySQL 使 用 3306 端 
口 ,MongoDB 使 用 27017 端口 ,大 多 数 情况 下 IRC 服务 器 使 用 6667 端口 ,IMAP 使 用 


143 端口 ,Oracle 使 用 1521,1158,8080,210 等 几 个 端口 ,等 等 。 


5. IP 地 址 


IP 运行 于 网 络 层 , 是 网 络 互 连 的 重要 基础 。IP 地 址 (32 位 或 128 位 二 进 制 数 ) 用 来 
标识 网 络 上 的 主机 ,在 公开 网 络 上 或 同一 个 局 域 网 内 部 ,每 台 主 机 都 必须 使 用 不 同 的 IP 
地 址 ;而 由 于 网 络 地 址 转换 (Network Address Translation. NAT) 和 代理 服务 器 等 技术 
的 广泛 应 用 ,不 同 内 网 之 间 的 主机 可 以 使 用 相同 的 IP 地 址 。 IP 地 址 与 端口 号 共同 来 标 
识 网 络 上 特定 主机 上 的 特定 应 用 进程 ,俗称 Socket。 
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6. MAC 地 址 


MAC 地 址 也 称 为 网 卡 物理 地 址 ,是 一 个 48 位 的 二 进 制 数 ,用 来 标识 不 同 的 网 卡 物 
理 地 址 。 本 机 的 IP 地 址 和 MAC 地 址 可 以 在 命令 提示 符 窗口 中 使 用 ipconfig/all 命令 查 
看 ,如 图 9-1 所 示 。 


: ERA 
gs 

E 

: SDIBT.EDU.CN 

: SDIBT.EDU.CN 


: Realtek PCle GBE Family Controller 
EC-88-6B-36-2C-31 


£688: :9876:98£9:5401:3111:11C E155 


Eae 18.2.1. 

202.194.104.139 

: 250390635 
900-01-90-01-18-6D-R5-D8-EC-88-6B-36-2C-31 


sees er ees s 3 202.194.104.35 
202.102.152.3 
219.146 .0.130 

TCPIP 上 的 NetBIOS .......: 已 启用 - 


图 9-1 使 用 ipconfig 命令 查看 本 机 的 IP 地 址 和 网 卡 的 物理 地 址 


(QARAR: 如 果 想 知道 某 个 IP 地 址 的 详细 信息 ,如 国家 、 城 市、 经 纬度 等 信息 ,可 
以 使 用 Python 扩展 库 pygeoip 配合 数据 库 GeoLiteCity. dat 来 获取 这 些 信息 。 其 中 ， 
pygeoip 可 以 使 用 pip 工具 安装 ,GeoLiteCity. dat 数据 库 可 以 从 网 上 下 载 。 当 然 ,信息 的 
准确 程度 主要 取决 于 下 载 的 数据 库 版 本 。 

>> > import pygeoip 

»»»gi- pygeoip.GeoIP ('GeoLiteCity.dat') 

»»»gi.record by name('221.0.95.247") 

('longitude': 116.99720000000002, 'area code": 0, 'region code': '25', 'oountry name': 'China', 'dma_ 

code': 0, 'postal code': None, 'continent': 'AS', 'city': 'Jinan', 'time zone': 'Asia/Shanghai', ' 

country oode': "ON, "country oode3': "CHN "metro oode': None, 'latitude': 36.66829999999999) 


9.2 Socket 编程 
远程 管理 软件 和 黑客 软件 大 多 依赖 于 Socket 来 实现 特定 功能 ,前 几 年 流行 的 端口 反 


弹 更 是 把 这 项 技术 发 挥 到 了 极致 。 
如 前 所 述 ,UDP 和 TCP 是 网 络 体系 结构 的 传输 层 运行 的 两 大 重要 协议 ,其 中 ,TCP 
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适用 于 对 效率 要 求 相 对 低 而 对 准确 性 要 求 相对 高 的 场合 ,如 文件 传输 .电子 邮件 等 ;而 
UDP 适用 于 对 效率 要 求 相 对 高 ,对 准确 性 要 求 相 对 低 的 场合 ,如 视频 在 线 点 播 、 网 络 语音 
通话 等 。 在 Python 中 ,主要 使 用 socket 模块 来 支持 TCP 和 UDP 编程 。 


921 UDP 编程 


在 很 多 年 以 前 普通 家 庭 还 没有 手机 、 电 话 \ 传 呼 机 的 时 候 , 主 要 靠 信 件 往来 联系 ,发 信 
人 填写 好 收 信人 地 址 然后 把 信件 邮寄 出 去 就 可 以 了 ,但 是 没 法 保证 对 方 一 定 能 收 到 这 封 
信和 (例如 对 方 换 了 地 址 ) ,也 不 能 保证 不 同时 间 的 几 封 信 按 照发 出 的 顺序 到 达 目 的 地 。 
UDP 的 工作 过 程 就 类 似 于 邮寄 普通 信件 , 它 属于 无 连接 协议 ,在 UDP 编程 时 不 需要 首先 
建立 连接 ,而 是 直接 向 接收 方 发 送信 息 。UDP 也 不 提供 应 答 和 重 传 机 制 , 无 法 保证 数据 
一 定 能 够 到 达 目 的 地 。UDP 最 大 的 优点 是 效率 高 ,其 首部 中 只 包含 双方 地 址 与 校 验 和 等 
很 少 的 字段 ,额外 开销 很 小 。UDP 编程 经 常用 到 的 socket 模块 方法 如 下 。 

(1) socket ([family[,type[L,proto]]]): 创建 一 个 Socket 对 象 , 其 中 family 为 
socket. AF INET 表示 IPv4 ,socket. AF. INET6 表示 IPv6;type 为 SOCK_STREAM 表 
示 使 用 TCP, SOCK_DGRAM 表示 使 用 UDP。 

(2) sendto(string.address) ; 把 string 指定 的 内 容 发 送 给 address 指定 的 地 址 ,其 中 
address 是 一 个 包含 接收 方 主机 IP 地 址 和 应 用 进程 端口 号 的 元 组 ,格式 为 (IP 地 址 , 端 
口号 )。 

(3) recvfrom(bufsize[ ,flags]) ; 接收 数据 。 

下 面 通过 一 个 示例 来 简单 了 解 一 下 如 何 使 用 UDP 进行 网 络 通信 。 

例 9-1 UDP 通信 程序 。 

发 送 端 发 送 一 个 字符 串 ,假设 接收 端 在 本 机 5000 端口 进行 监听 ,并 显示 接收 的 内 容 ， 
如 果 收 到 字符 串 bye( 忽 略 大 小 写 ) 则 结束 监听 。 

接收 端 代码 : 

inport socket 

# 使 用 IPv4 协 议 ,使 用 UDP 传输 数据 

s-socket.socket(socket.AF INET, socket.SOCK DGRAM) 

# 绑 定 端口 和 端口 号 , 空 字符 串 表 示 本 机 任何 可 用 1e hl 

s.bind(('', 5000)) 

while True: 

data, addr- s.recvfrem(1024) 
# 显 示 接 收 到 的 内 容 
print('received message: (0) from FORT (1) on (2)' fonat (data.decode () 
addr[1], addr[0])) 
if data.decode () .lower()== 'bye' : 
break 
s.close() 


发 送 端 代码 : 
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inport socket 
inport sys 

s= socket .socket (socket .AF_INET, socket.SOCK DGRAM) 
# 假 设 192.168.0.103 是 接收 端 机 器 的 下 地 址 
3.3endto (sys.argv [1] .encode () , ("192.168.0.103" ,5000) ) 
s.close() 


将 上 面 的 代码 分 别 保存 为 receiver. py 和 sender. py, 然 后 首先 启动 一 个 命令 提示 符 
环境 并 运行 接收 端 程序 ,这 时 接收 端 程序 处 于 阻塞 状态 , 接 下 来 再 启动 一 个 新 的 命令 提示 
符 环境 并 运行 发 送 端 程序 ,此 时 会 看 到 接收 端 程序 继续 运行 并 显示 接收 到 的 内 容 以 及 发 
送 端 程序 所 在 计算 机 IP 地 址 和 占用 的 端口 号 。 当 发 送 端 发 送 字 符 串 'bye 后 ,接收 端 程序 
结束 ,此 后 再 次 运行 发 送 端 程序 时 接收 端 没 有 任何 反应 ,但 发 送 端 程序 也 并 不 报错 。 这 正 
是 UDP 的 特点 , 即 “ 尽 最 大 努力 传输 ”, 并 不 保证 非常 好 的 服务 质量 。 运 行 过 程 如 图 9-2 
所 示 。 


[EE 


PP —- — - as 


:Python35>python receiver.py 

ceived message:hello from PORT 61681 on 192.168.80.103 
ceived message:'hello from PORT 61684 on 192.168.0.103 
ceived message:hello world from PORT 61687 on 192.168.0.103 
ceived message:godd morning from PORT 61692 on 192.168.8.103 
ceived nessage:1234567 fron PORT 61713 on 192.168.0.103 
ceived message:SDIBT from PORT 61718 on 192.168.0.103 
ceived message:Bye from PORT 61719 on 192.168.0.103 


Ic:NPython355 | BW 邻 令 提 示 符 


C: \Python35>python sender.py hello world 
C:\Python35>python sender.py "hello vorld' 
Ic: NPython35?python sender.py "hello world" 
Ic: NPython35?python sender.py "godd morning" 
C: NPythond5?python sender.py 1234567 

CC: \Python35>python sender.py SDIBT 
CC:\Python35>python sender.py Bye 

C: \Python35>python sender.py hi 


C: Python35>python sender.py Why? 


Ic: \Python35> 


9-2 UDP 通信 程序 运行 结果 


(QARAR: 使 用 Python 查看 本 机 的 IP 地 址 与 网 卡 的 物理 地 址 。 在 上 面 的 发 送 
端 程序 中 假设 接收 端 主机 的 IP 地 址 为 192. 168. 0. 103 ,可 能 与 你 的 计算 机 配置 并 不 一 
样 。 可 以 在 命令 提示 符 环境 中 使 用 命令 ipconfig/all 查看 本 机 的 IP 地 址 ,如 图 9-1 所 示 ， 
然后 对 发 送 端 代码 中 的 IP 地 址 进行 相应 修改 。 如 果 对 命令 提示 符 不 熟悉 ,也 可 以 使 用 下 
面 的 Python 代码 来 获取 本 机 的 IP 地 址 和 网 卡 的 物理 地 址 。 


import socket 
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import wid 


ip= socket .gethostbyname (socket .gethostname () ) # 本 机 的 redihb 

node- uid.getnode () 

macHex= unid.UUTD (int node) -hex[- 12:] 

mac- [] 

for i in range (len (macHex)) [1:2]: 

mac.append (macHex [i:i+ 2]) 

mac- ':' join (mac) # 网 卡 的 物理 地 址 

print('IP:', ip) 

print (MC:', mac) 

(以 拓展 知识 : 发 送 数据 时 ,如 果 目 标 ]JP 地 址 中 最 后 一 组 数字 是 255, 表 示 广 播 地 址 ， 
也 就 是 说 局 域 网 内 的 所 有 主机 都 会 收 到 信息 。 在 本 书 第 16 章 介绍 的 课堂 教学 管理 系统 
中 服务 器 自动 发 现 功能 就 用 到 了 UDP 广播 技术 。 


922 TOP 编程 


TCP 一 般 用 于 要 求 可 靠 数据 传输 的 场合 。 编 写 TCP 程序 时 需要 用 到 的 socket 模块 
方法 主要 如 下 。 

(1) connect(address) : 连接 远程 计算 机 。 

(2) send(bytes[ ,flags]): 发 送 数据 。 

(3) recvCbufsize[ ,flags]) : 接收 数据 。 

(4) bindCaddress) ; 绑 定 地 址 。 

(5) listen(backlog): 开始 监听 ,等待 客户 端 连接 。 

(6) accept() : 响应 客户 端的 请 求 ,接收 一 个 连接 。 

下 面 通过 一 个 示例 来 演示 如 何 使 用 TCP 进行 通信 ,在 本 书 第 16 章 介 绍 的 课堂 教学 
管理 系统 中 还 演示 了 如 何 通 过 TCP 来 传送 文件 ,以 及 如 何 进行 远程 屏幕 截图 。 

例 9-2 会 聊天 的 小 机 器 人 。 

使 用 TCP 进行 通信 需要 首先 在 客户 端 和 服务 端 之 间 建 立 连接 ,并 且 要 在 通信 结束 后 
关闭 连接 以 释放 资源 。TCP 能 够 提供 比 UDP 更 好 的 服务 质量 (Quality of Service. 
QoS» ,通信 可 靠 性 有 本 质 上 的 提高 。 下 面 的 代码 简单 模拟 了 机 器 人 聊天 软件 原理 ,服务 
端 提前 建立 好 字典 ,然后 根据 接收 到 的 内 容 自动 回复 。 当 然 ,这 个 程序 对 客户 端的 信息 是 
进行 严格 匹配 ,大 家 可 以 尝试 结合 5. 1. 3 节 介 绍 的 分 词 功 能 ,设计 一 个 合适 的 模糊 匹配 算 
法 ,就 可 以 实现 聊天 机 器 人 了 。 

服务 端 代码 : 


import socket 
words- ('how are you? ' : Fine, thank you.', ‘how old are you? ':'38', 


"what is your name? ':'Dong FuGuo', 'what's your name? ':'Dong FuGuo', 
"where do you work? ':'SDIBT', "bye':'Bye'] 
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HS"! 
FORT= 50007 
S= socket .socket (socket .AF_INET, socket. SOCK STREAM) 
MGE socket 
s.bind( (HOST, FORT) ) 
# 开 始 监听 一 个 客户 端 连接 
s.listen(1) 
print ('Listening at port: ', FORT) 
conn, addr- s.acoept () 
print ('Connected by', addr) 
while True: 

data= conn.recv (1024) 

data= data.deoode () 

if not data: 

break 

print('Received message:', data) 

conn.sendall (words.get(data, 'Nothing') .encode ()) 
conn.close() 
s.close() 


客户 端 代 码 : 


import socket, sys 


# 服 务 端 主机 的 到 地 址 和 端口 号 
HOST= '127.0.0.1' 
FORT= 50007 
s= socket .socket (socket .AF_INET, socket.SOCK STREAM) 
try: 
# 连 接 服务 器 
S.connect((HOST, FORT)) 
except Exception as e: 
print('Server not found or not open') 
sys.exit ) 
while True: 
c= input ("Input the content you want to send:') 
# 发 送 数据 
s.sendall (c.encode ()) 
# 从 服务 端 接收 数据 
data- s.recv (1024) 
data= data.decode () 
print ('Received:', data) 
bye": 


if c.lowr(-- 
break 
# 关 闭 连接 


300 $ Python 可 以 这 样 学 


s 
s.close() 


将 上 面 的 代码 分 别 保存 为 server. py 和 client. py 文件 ,然后 启动 一 个 命令 提示 符 环 
境 并 运行 服务 端 程序 ,服务 端 开 始 监听 ;启动 一 个 新 的 命令 提示 符 环 境 并 运行 客户 端 程 
序 ,服务 端 提示 连接 已 建立 ;在 客户 端 输入 要 发 送 的 信息 后 ,服务 端 会 根据 提前 建立 的 字 
典 来 自动 回复 。 服 务 端 每 次 都 在 固定 的 端口 进行 监听 ,而 客户 端 每 次 建立 连接 时 可 能 会 
使 用 不 同 的 端口 。 如 果 服 务 端 程序 没有 运行 ,那么 客户 端 就 无 法 建立 连接 ,当然 也 无 法 发 
送 任何 信息 ,这 正 是 TCP 区 别 于 UDP 的 地 方 。 运 行 过 程 如 图 9-3 所 示 。 


[uU mm 


:NPython35?python server.py 
istening at port: 58007 

nnected by (127.8.0.1', 16252) 
ceived message: what's your nane? 
ceived message: hov old are you? 
ceived message: how are you? 
ceived message: what are you doing? 
ceived message: bye 


:\Python35》 | gg s: 


Ic: NPython3S?python client.py 

nput the content you want to send:what's your name? 
Received: Dong FuGuo 

Input the content you want to send:how old are you? 
Received: 38 

Input the content you want to send:how are you? 
Received: Pine,thank you. 

Input the content you want to send:uhat are you doing?| 
Received: Nothing 

Input the content you want to send:bye 
Received: Bye 


:NPython35?python client.py 
erver not found or not open 
E: Python35> 


图 9-3 TCP 通信 程序 运行 结果 


OU 拓展 知识 : Python 标准 库 socket 除了 支持 UDP 和 TCP 编程 之 外 ,还 提供 了 用 来 
获取 本 地 主机 名 的 gethostname()、 根 据 主 机 名 获取 IP 地址 的 gethostbyname()、 根 据 IP 地 
址 获取 主机 名 的 gethostbyaddr() ,根据 端口 号 获取 对 应 服务 名 称 的 getservbyport()、 根 据 服 
务 名 称 获 取 对 应 端口 号 的 getservbyname() 等 方法 。 


923 网 络 嗅 探 器 


嗅 探 器 程序 可 以 检测 本 机 所 在 局 域 网 内 的 网 络 流量 和 数据 包 收 发 情况 ,对 于 网 络 管 
理 具 有 重要 作用 ,也 属于 系统 运 维 内 容 之 一 。 为 了 实现 网 络 流量 嗅 探 ,需要 将 网 卡 设置 为 


例 9-3 网 络 嗅 探 器 程序 。 
下 面 的 代码 运行 60s, 然 后 输出 本 机 所 在 局 域 网 内 非 本 机 发 出 的 数据 包 , 并 统计 不 同 
主机 发 出 的 数据 包 数 量 。 关 于 多 线程 的 知识 请 参考 第 10 章 。 


import socket 
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inport threading 
inport time 


activeDegree- dict () 
flag-1 
def main(): 
glcbal activeDegree 
glæal flag 
# 获 取 本 机 下 地 址 
HOST- socket.gethostbyname (socket .gethostname () ) 
# 创 建 原始 套 接 字 , 适 用 于 Windows 平 台 
# 对 于 其 他 操作 系统 ,要 把 sockec.1PPROTO _ IP 替换 为 socket. IPPROTO_ IOMP 
S-socket.socket(socket.AF INET, socket.SOCK RAW, socket.IPFROTO IP) 
3.bind( (HOST, 0)) 
# 设 置 在 捕获 的 数据 包 中 含有 PUA 
s.setsockcpt(socket.IPPROTO IP, socket.IP HIRINCL, 1) 
# 启 用 混杂 模式 ,捕捉 所 有 数据 包 
s.ioctl(socket.SIO RCVALL, socket.RCVALL ON) 
# 开 始 捕捉 数据 包 
while flag: 
cœ s.recvfram(65565) 
host- c[1] [0] 
activeDegree[host]- activeDegree.get (host, 0)* 1 
# 假 设 本 机 Pd BE 10.2.1.8 
if c[1] [0] != '10.2.1.8': 
print (c) 
# 关 闭 混杂 模式 
s.ioctl(socket.SIO RCVALL, socket.RCVALL OFF) 
S.close() 
t= threading.Thread (target- main) 
t.start() 
time.sleep (60) 
flag-0 
七 .join () 
for item in activeDegree.items () : 
print (item) 
(QARAR: sniffer pro 是 NAI 公 司 出 品 的 一 款 一 流 的 便携 式 网 管 和 应 用 故障 诊 
断 分 析 软 件 ,拥有 强大 的 网 络 抓 包 和 协议 分 析 能 力 , 软 件 能 够 完美 支持 全 系统 Windows 
台 , 性 能 优越 ,是 网 络 管理 员 必 备 的 一 款 网 络 协议 分 析 软 件 。 
(如 拓展 知识 : scapy 是 一 款 功 能 非常 强大 的 交互 式 包 处 理 程序 ,可 以 伪造 或 解码 很 
多 种 网 络 协议 的 数据 包 , 可 以 发 送 和 捕获 数据 包 , 可 以 对 请 求 数 据 包 和 回复 数据 包 进行 匹 
配 , 可 以 处 理 扫描 、 路 由 跟踪 ,探测 、 单 元 测试 .攻击 、 网 络 发 现 等 任务 ,还 具有 很 多 其 他 工 
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具 所 不 具有 的 功能 。 如 果 使 用 scapy, 可 能 需要 暂时 切换 到 Linux 4- Python 2. 7. x RÈ 
(这 也 是 很 多 涉及 软件 安全 、 系 统 安全 和 网 络 安全 的 Python 扩展 库 的 推荐 运行 平台 ,最 
起 码 目前 是 这 样 的 ) ,因为 在 Windows 平台 上 搭建 scapy 环境 实在 是 有 点 麻烦 。 如 果 对 
Linux 不 太 熟 悉 的 话 ,也 不 用 过 于 担心 ,配置 的 过 程 并 不 是 特别 复杂 。 以 Ubuntu 为 例 ， 
使 用 pip install scapy 即 可 安装 ,然后 使 用 vim 编写 下 面 的 Python 代码 并 保存 为 sniff. py 
文件 ,然后 执行 sudo python sniff. py 即 可 ,最 后 启动 9. 2.6 节 中 的 FTP 程序 ,可 以 发 现 
sniff. py 程序 成 功 地 捕获 了 我 们 感 兴趣 的 信息 。 当 然 , 如 果 需 要 编写 对 特定 程序 网 络 数 
据 包 的 收发 情况 嗅 探 程 序 , 需 要 对 目标 程序 的 通信 协议 有 一 定 的 了 解 才 行 。 另 外 ,dpkt 
也 是 一 款 不 错 的 网 络 数 据 包 分 析 工 具 , 大 家 可 以 查阅 相关 资料 。 


fram scapy.all import * 
# 回 调 函 数 ,每 个 捕获 的 数据 包 都 用 这 个 函数 处 理 
def packet. callback (packet) : 
if packet [TCP] .payload: 
temp packet- str (packet [TCP] .payload) . lower () 
if 'zhangsan' in temp packet: 
print '$s'$packet[TCP] .payload 

# 开 始 嗅 探 与 TcP 端 口 10600 有 关 的 数据 包 , 并 且 不 在 内 存 中 存储 
sniff(filter- 'tcp port 10600', prn- packet callback, store= 0) 


924 多 进程 端口 扫描 器 


说 到 扫描 器 ,就 不 得 不 提 到 一 个 经 典 的 扫描 软件 xscan, 相 信和 热爱 黑客 和 网 络 安全 技 
术 的 读者 都 用 过 这 个 软件 ,这 个 小 软件 能 够 扫描 的 内 容 包括 远程 服务 类 型 .操作 系统 类 型 
及 版 本 、 各 种 弱 口 令 漏洞 .后 门 、 应 用 服务 漏洞 .网 络 设备 漏洞 .拒绝 服务 漏洞 20 多 个 
大 类 。 

一 般 而 言 , 绝 大 多 数 成 功 的 网 络 攻击 都 是 以 端口 扫描 开始 的 。 在 网 络 安全 和 黑客 领 
域 , 端 口 扫描 是 经 常用 到 的 技术 ,可 以 探测 指定 主机 上 是 否 开放 了 特定 端口 ,进一步 判断 
主机 上 是 否 运 行 某 些 重 要 的 网 络 服务 ,最 终 判 断 是 否 存在 潜在 的 安全 漏洞 ,从 一 定 意义 上 
讲 也 属于 系统 运 维 的 范畴 。 

例 9-4 端口 扫描 器 程序 。 

下 面 代码 模拟 了 端口 扫描 器 的 工作 原理 .并 采用 多 进程 技术 提高 扫描 速度 ,关于 多 进 
程 编程 请 参考 第 10 章 。 


import socket, sys 


def ports(ports service): 
# 获 取 常 用 端口 对 应 的 服务 名 称 
for port in list (range (1,100))+ [143, 145, 113, 443, 445, 3389, 8080] : 
try: 
ports service[port]- socket .getservbyport (port) 
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except socket.error: 


def ports scan(host, ports service): 
ports cpen- [] 
try: 
sock-socket.socket(socket.AF INET, socket.SOCK STREAM) 
# 超 时 时 间 的 不 同 会 影响 扫描 结果 的 精确 度 
Sock.settimeout (0.01) 
except. socket .error: 
print ('socket creation error') 
sys.exit () 
for port in ports service: 
try: 
# 尝 试 连接 指定 端口 
Sock.connect ( (host,Port)) 
# 记 录 打 开 的 端口 
Ports_open.append (port) 
sock.close() 
except socket.error: 


ports service- dict () 

results- dict () 

ports(ports service) 

# 创 建 进程 池 ,允许 最 多 8 个 进程 同时 运行 

pool= miltiproœssing. Pool (processes- 8) 

net- '10.2.1.' 

for host number in map(str, range (8,10) ) : 
host-net*host number 
# 创 建 一 个 新 进程 ,同时 记录 其 运行 结果 
results[host]-pool.apply async(ports scan, (host, ports service)) 
print('starting '+host+ '**') 

# 关 闭 进程 池 ,close() 必 须 在 join(0 之 前 调用 

pool.close() 

# 等 待 进程 池 中 的 进程 全 部 执行 结束 


pool.join() 


# 打 印 输出 结果 
for host in results: 
print ('='* 30) 
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print (host, '.' * 10) 
for port in results[bost] get () : 
print(port, ':', ports service[port]) 

(QARAR, 运行 例 9-4 的 代码 会 发 现 , 虽 然 扫描 效果 不 错 ,但 是 速度 非常 慢 , 远 不 
如 xscan 快 。 究 其 原因 ,是 上 面 的 代码 使 用 TCP 进行 探测 ,而 TCP 需要 首先 通过 “三 次 
握手 ”建立 连接 ,通信 后 还 需要 断 开 连接 ,这 些 操作 对 速度 的 影响 非常 大 。 为 了 追求 更 快 
的 速度 ,可 以 考虑 改 用 UDP 进行 探测 。 当 发 送 一 个 UDP 数据 包 到 网 络 上 主机 的 某 个 关 
闭 的 UDP 端口 时 ,目标 主机 通常 会 返回 一 个 ICMP 包 指 示 目 标 端口 不 可 达 , 这 就 意味 着 
目标 主机 是 存活 的 。 可 以 使 用 UDP 对 整个 子 网 内 所 有 主机 发 送信 息 , 然 后 等 待 这 些 主 
机 的 ICMP 响应 ,而 这 个 过 程 的 开销 几乎 可 以 忽略 不 计 。 

( 惧 拓展 知识 : Python 扩展 库 netaddr 提供 了 大 量 可 以 处 理 网 络 地 址 的 类 和 对 象 。 
15] de , netaddr. valid_ipv4 (addr) 可 以 判断 addr 是 否 为 合法 的 IPv4 地 址 , netaddr. 
IPNetwork('10. 2. 1. 0/24) 和 netaddr. IPRange('10. 2. 1. 0','10. 2. 1. 255) 都 可 以 用 来 生成 
包含 介 于 10.2.1.0 到 10.2.1.255 2c I] IP 地址 的 选 代 对 象 。 

(以 拓展 知识 : 在 例 9-4 的 代码 中 是 使 用 IP 地 址 来 表示 目标 主机 的 ,但 是 很 多 网 站 
为 了 防止 黑客 攻击 或 者 进行 负载 均衡 ,会 经 常 变换 主机 ,这 样 同 一 个 域名 在 不 同时 间 可 能 
会 对 应 不 同 的 IP 地 址 ,在 这 种 情况 下 可 以 通过 socket 模块 的 gethostbyname() 函 数 来 实 
时 获取 目标 主机 的 IP 地 址 。 下 面 的 代码 连续 不 间断 地 跟踪 指定 目标 主机 的 IP 地 址 变化 
情况 。 

fram time import sleep 

fram socket import gethostbyname 

fram datetime import datetime 


def get ipAddresses (url): 
ipAddresses- [0] 
while True: 
sleep(0.5) VEL EE 0.55 
ip- gethostbyname (ur1) 
if ip != ipactiresses[- 1]: # 目 标 主机 IP 地 址 发 生变 化 
ipadtresses.append (ip) 
print (str (datetime.now()) [:19]+ '===> '+ ip) 
get ipAddresses (r'www.microsoft.ocm') 


(QARAR: Nmap 是 一 款 非常 棒 的 网 络 扫描 工具 ,首先 下 载 并 安装 Nmap 工具 ， 
把 安装 路 径 添 加 到 系统 Path 环境 变量 ,然后 使 用 pip 安装 python-nmap ,就 可 以 使 用 了 。 
例如 下 面 的 代码 : 

import socket 

inport mmap 


rmScan- rmap. PortScanner () 


ip- socket .gethostbyname (‘www.microsort .oom') 


nmScan. scan (ip, '80') 
print (nScan [ip] ['tcp'] [80] ['state']) 
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# 创 建 端口 扫描 对 象 

# 获 取 目 标 主机 的 103 hE 
# 扫 描 指定 端口 

# 查 看 端口 状态 


925 代理 服务 器 端口 映射 功能 的 实现 


端口 映射 是 网 络 地 址 转换 (Network Address Translation ,NAT) 技 术 的 实现 方法 之 
一 ,也 是 代理 服务 器 的 必 备 功能 之 一 ,其 基本 原理 是 在 两 个 端口 之 间 进 行 消息 转发 ,可 以 
用 来 实现 内 网 和 外 网 之 间 的 通信 ,有 效 利用 有 限 的 TP 地址, 并且 可 以 进行 必要 的 过 滤 来 
保护 内 网 的 安全 。 

(1) 模拟 服务 端 代码 (sockMiddle_server. py) 如 下 : 

inport sys 

import socket 

inport threading 


# 回 复 消息 ,原样 返回 
def replyMessage (conn) : 
while True: 
data= conn.recv (1024) 
conn.send (data) 
if data.decode() .1ower ()== 'bye' : 
break 
conn.close() 


def main(): 
SockScr- socket.socket(socket.AF INET, socket.SOCK STREAM) 
sSockScr.bind((*', port)) 
SockScr.listen (200) 
while True: 
try: 
conn, addr- sockScr.acoept () 
# 只 允许 特定 主机 访问 本 服务 器 
if addr[0] != onlyYou: 
conn.close() 
continue 
# 创 建 并 启动 线程 
t= threading. Thread (target- replyMessage, args- (conn,)) 
t.start () 


print ('error') 
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try: 
# 获 取 命 令 行 参数 ,port 为 服务 器 监听 端口 
# 只 允许 下 地 址 为 onlyYou 的 主机 访问 
port- int (sys.argv[1]) 
onlyYou- sys.argv [2] 
mein() 

exoept: 
print ('Mist give me a number as port!) 


(2) 模拟 代理 服务 器 代码 (sockMiddle. py) 如 下 : 


import sys 
import socket 
import threading 


def middle (conn, addr): 
# 面 向 服务 器 的 Socket 
sockDst- socket.socket(socket.AF INET, socket.SOCK STREAM) 
SockDst connect ( (àpServer,portServer)) 
while True: 
data= conn. recy (1024) .decode () 
Print(" 收 到 客户 端 消息 :"+ data) 
if data == ' 不 要 发 给 服务 器 ': 
conn.send(" 该 消息 已 被 代理 服务 器 过 滤 '.encode0) 
Print(" 该 消息 已 过 滤 ") 
elif data.lower ()== 'bye': 
print (str (adr) e ' 客 户 端 关闭 连接 ') 
break 
else: 
sockDst .send (data.encode () ) 
print ("Cb H RIRS 88 ") 
data framServer- sockDst..recv (1024) .decode () 
Print(" 收 到 服务 器 回复 的 消息 : Ue data framserver) 
if dta fromserver == ' 不 要 发 给 客户 端 ': 
conn.send(" 该 消息 已 被 代理 服务 器 修改 '.encode()) 
print ("消息 已 被 自 改 ') 
else: 
conn.send(b'Server reply:"+ data_frarServer.encode()) 
print(' 已 转发 服务 器 消息 给 客户 端 ') 


conn.close () 


sockDst..close () 


def main () : 
sockScr-socket.socket(socket.AF INET, socket.SOCK STREAM) 
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sockScr.bind(('', portScr)) 

sockScr. listen (200) 

Erint(" 代 理 已 启动 ) 

while True: 

try: 

conn, akir- sockScr accept. () 
t-threading.Thread(target- middle, args- (conn, addr)) 
t.start () 
print ("新 客户 :'+ str (addr)) 


# (本 机 到 地 址 ,portscr)<==> (ipServer,portServer) 
# 代 理 服务 器 监听 端口 
portScr- int (sys.argv[1]) 
# 服 务 器 王 地 址 与 端口 号 
ipServer- sys.argv[2] 
portServer- int (sys.argv[3]) 
mein() 
exoept: 
print ('Sth error") 


(3) 模拟 客户 端 代码 (sockMiddle_client. py) 如 下 : 


inport sys 
import socket 


def main(): 
sock- socket.socket(socket.AF INET, socket.SOCK STREAM) 
Sock.connect ( (ip, port) ) 
while True: 
data= input ('What do you want to ask:') 
Sock.send (data .encode () ) 
print (sock.recv (1024) decode () ) 
if data.lower()-- 'bye': 


Sock.close() 


# 代 理 服 务 器 的 了 地址 和 端口 号 
ip- sys.argv [1] 
port- int (sys.argv[2]) 
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main() 
except: 
print('Sth error") 
代码 编写 完成 后 ,启动 3 个 命令 提示 符 窗口 ,分 别 执行 以 下 3 个 命令 启动 服务 器 、 代 
理 服务 器 和 客户 端 ,然后 就 可 以 在 客户 端 发 送 消息 了 。 


python sockMidile server.py 10000 10.2.1.2 
python sockMiddle.py 30800 10.2.1.2 10000 
python sockMidile client.py 10.2.1.2 30800 


可 以 看 出 ,代理 服务 器 代码 能 够 对 客户 端 和 服务 端 之 间 的 通信 内 容 进行 记录 ,也 能 够 
修改 双方 的 通信 内 容 , 这 样 实际 上 是 存在 潜在 危险 的 。 只 要 代理 服务 器 想 这 样 做 ,客户 在 
网 络 上 的 通信 基本 上 就 没有 什么 隐私 可 言 了 。 因 此 ,如 果 涉 及 金钱 交易 最 好 不 要 使 用 代 
理 服务 器 ,也 尽量 不 要 使 用 外 面 免费 的 Wi-Fi 网 络 ,因为 我 们 没 法 保证 那些 代理 服务 器 和 
路 由 器 除了 提供 正常 通信 功能 之 外 还 会 做 些 什么 。 


926 自己 编写 FIP 通 信 软 件 


看 到 这 一 节 的 标题 ,大 家 的 第 一 反应 大 概 可 以 分 为 3 类 : 不 是 已 经 有 很 成 熟 的 
FTP 程序 了 吗 , 还 有 必要 自己 编写 吗 ? @ 太 高 深 了 吧 , 真 的 可 以 自己 编写 FTP 服务 器 和 
客户 端 吗 ? 回 太 难 ,我 选择 直接 跳 过 这 一 节 内 容 。 

现 有 的 FTP 程序 确实 已 经 非常 成 熟 ,稳定 了 ,那么 为 什么 还 要 自己 编写 FTP 程序 
呢 ? 首先 ,可 以 更 加 熟悉 Python 代码 的 编写 。 其 次 ,并 不 是 时 时 刻 刻 都 可 以 使 用 现 有 的 
FTP 程序 的 ,比如 目标 主机 上 没有 安装 FTP 服务 或 者 防火 墙 拦截 了 外 部 的 FTP 访问 。 
比如 说 ,我 们 “一 不 小 心 ” 进 入 了 一 台 不 属于 自己 的 计算 机 ,并 且 想 把 自己 计算 机 上 的 一 个 
文件 传送 到 对 方 计算 机 上 ,而 对 方 计算 机 的 防护 机 制 不 允许 直接 上 传 文件 , 却 恰好 安装 了 
Python 解释 器 (肯定 有 读者 会 问 怎么 这 么 巧 , 但 事实 是 绝 大 多 数 版 本 的 Linux 系统 都 默 
认 安 装 了 Python 解释 器 ) ,这 样 我 们 就 可 以 编写 两 段 代 码 , 把 自己 的 计算 机 当做 服务 器 ， 
从 目标 主机 上 把 文件 下 载 过 去 就 可 以 了 。 关 键 是 一 切 都 在 自己 的 掌握 之 中 ,感觉 确实 
不 错 。 

凡事 预 则 立 ,不 预 则 废 。 日 本 近代 作家 夏目 汶 石 的 作品 人心 }? 中 有 句 名言“ 没有 天 生 的 
武士 ,也 没 人 生来 平凡 ,是 我 们 自己 成 就 了 自己 ”, 也 表达 了 相同 的 意思 。 我 们 确实 可 以 自 
己 开发 FTP 程序 ,看 完 下 面 的 代码 就 会 发 现 ,自己 编写 FTP 程序 还 真 不 是 什么 难事 ,所 
以 ,既然 走 过 路 过 就 千 万 不 要 错过 ,让 我 们 一 起 看 看 如 何 编写 FTP 服务 器 和 客户 端 代码 。 

CD 服务 端 代码 (ftpServer. py) 为 
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UU P ES BEBE 

# 也 可 以 把 这 些 信 息 存放 到 数据 库 中 

users {"zhangsan':{f'pwd':rzhangsan1234'，"hame':r'c:NPython 3.5'}, 
*lisi':Upead':'lisi567', "hae": 'c:\\'H 


def server (conn,addr, hame) : 
print ("新 客户 端 :'+ str (addr) ) 
# 进 入 当前 用 户主 目录 
os.chdir hawe) 
while True: 
data= conn. recv (100) .decode () .lower () 
# 显 示 客 户 端 输入 的 每 一 条 命令 
print (data) 
# 客 户 端 退 出 
if data in('quit', 'q'): 
break 
# 查 看 当前 文件 夹 的 文件 列表 
elif data in('list', 'ls', 'dir'): 
files- str (os.listdir(os.getcwd())) 
files- files.encode () 
# 先 发 送 字 节 串 大 小 ,再 发 送 字 节 串 
conn.send(struct.pack('I', len(files))) 
conn.send (files) 
# 切 换 至 上 一 级 目录 
elif ''.join(data.split ())== 'od..': 
wd os.getcwd () 
newCwd- cwd[:cwd. rindex (NV!) ] 
# 考 虑 根 目录 的 情况 
if newowd[- 1] == ':': 
newCwd += 'NV* 
# 限 定 用 户主 目录 
if newCwd.lower () .startswith (home) : 
os.chdir (newOwd) 
conn.send (b'ok") 
else: 
conn.send (b'error') 
# 查 看 当前 目录 
elif data in('cwd', 'od'): 
conn. send (str (os.getcwd () ) encode () ) 
elif data.startswith ('od '): 
# 指 定 最 大 分 隔 次 数 , 考 虑 目标 文件 夹带 有 空格 的 情况 
# 只 允许 使 用 相对 路 径 进 行 跳 转 
data- data.split (maxsplit- 1) 
if len(data)--2 and os.path.isdir(data[1])V 
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and data[1] !- os.path.abspath (data[1]) : 
os.chdir (data[1]) 
conn.send (b'ok") 
else: 
conn.send (b'error') 
# 下 载 文件 
elif data.startswith('get '): 
data= data.split (mxsplit- 1) 
# 检 查 文件 是 否 存在 
if len(data)- - 2 and os.path.isfile (data[1]) : 
conn.send (b'ok') 
fp-cpen(data[1], 'rb') 
while True: 
content fp.read (4096) 
# 发 送 文件 结束 
if not content: 
conn.send (b'overxxxx' ) 
break 
# 发 送 文件 内 容 
conn.send(content) 
if conn.recv (10)- - b'ok' : 
continue 
fp.close() 
else: 
conn.send (b'no') 
# 无 效 命令 
else: 
pass 


conn.close() 
print (str addr)+ "关闭 连接 7) 


# 创 建 socket, 监 听 本 地 端口 ,等 待 客户 端 连接 
sock= socket.socket(socket.AF INET, socket.SOCK STREAM) 
Sock.bind(('*, 10600)) 
sock.listen (5) 
while True: 
conn, addr- sock.acoept. () 
# 验 证 客户 端 输 入 的 用 户 名 和 密码 是 否 正确 
userId, userPwd- conn.recv (1024) .Gecode () split (', ') 
if userId in users and users [userTd] ['pwd'] == userPwd: 
conn.send (b'ck') 
# 为 每 个 客户 端 连接 创建 并 启动 一 个 线程 
# 人 参数 为 连接 .客户 端 地 址 、 客 户主 目录 
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hane users [userId] ['hare"] 
t= threading. Thread (target server, args- (oonn,addr,hoe) ) 
t.daemon- True 
t.start() 

else: 


conn. send (b'error") 
(2) 客户 端 代码 (ftpClient. py) y 


import socket 
inport sys 
import re 
import struct 
inport getpass 


def main(serverIP): 
sock- socket.socket(socket.AF INET, socket.SOCK STREAM) 
Sock.connect ((serverIP, 10600)) 
userId input (' 请 输入 用 户 名 :') 
# 使 用 getpass 模 块 的 getpass 0 方法 获取 密码 ,不 回 显 
userPwd- getpass.getpass(" 请 输入 密码 :') 
message- userIdt ', '+ userPwd 
sock.send (message encode () ) 
login- sock.recv (100) 
# 验 证 是 否 登 录 成 功 
if login ==b'error': 
print (用 户 名 或 密码 错误 )) 
retum 
# 整 数 编码 大 小 
intSize- struct.calcsize('I') 
while True: 
HEKE Pu p HP o Je E 
camand- input ('##> ') .lower () .strip() 
# 没 有 输入 任何 有 效 字符 ,提前 进入 下 一 次 循环 ,等 待 用 户 继续 输入 
if not omand: 
continue 
# 向 服务 端 发 送 命令 
omman ' ' . join (command. split ()) 
Sock.send (cammand. encode () ) 
# 退 出 
if omand in('quit', 'q'): 
break 
# 查 看 文件 列表 
elif oamend in('list', 'ls', 'dir"): 


# 先 接收 字 节 串 大 小 ,再 根据 情况 接收 合适 数量 的 字 节 串 
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loc size- struct.unpack('I', sock.recv (intSize)) [0] 
files=eval (sock.recv (loc size).deoode()) 
for item in files: 
print (item) 
# 切 换 至 上 一 级 目录 
elif ''.join(ommand.split ())== 'od..': 
print (sock. recv (100) .decode () ) 
# 查 看 当前 工作 目录 
elif command in('owi', 'od'): 
print (sock.recv(1024) .decode () ) 
# 切 换 至 子 文件 夹 
elif oamend.startswith ('cd '): 
print (sock. recv (100) .decode () ) 
# 从 服务 器 下 载 文件 
elif command.startswith('get '): 
isFileExist- sock.recv (20) 
# 文 件 不 存在 
if isFileExist !-b'ok': 
print ('error') 
# 文 件 存在 ,开始 下 载 
else: 
print ('downloading.', end- '') 
fp- open (omand. split () [1], 'wb') 
while True: 
# 显 示 进 度 
print('.', end '') 
data= sock.recv (4096) 
if data --b'overooa' : 
break 
名 -write (data) 
Sock.send(b'ok') 
fp.close() 
print ('ok*) 


# 无 效 命令 
else: 
print (' 无 效 命令 ') 


sock.close() 


if nme 
if len(sys.argy)! 
print ('Usage: (0) serverIPAdHress' . format (sys.argv[0])) 

exit() 


serverIP- sys.argv[1] 
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# 使 用 正则 表达 式 判 断 服 务 器 地 址 是 否 为 合法 的 下 地 址 
if re.mtch(r'^\d{1,3}.\d{1,3}-\d{1,3}-\d{1,3}$ ', serverTP) : 
main (serverIP) 
else: 
print ("服务 器 地 址 不 合法 ') 


exit() 


(QARAR: Python 标准 库 ftplib 提供 了 FTP 客户 端的 主要 功能 。 下 面 的 代码 可 
以 用 来 测试 目标 主机 上 的 FTP 服务 是 否 允 许 匿名 登录 , 稍 加 改写 后 也 可 以 用 来 暴力 破解 
FTP 服务 器 的 账号 和 密码 ,请 参考 第 6 章 破 解压 缩 文件 密码 和 第 14 章 破解 MD5 值 有 关 
的 内 容 。 


>>> inport ftplib 
>>> ftp= ftplib.FTP ('127.0.0.1') 
>>>try: 
ftp.login ('anonymous' , "1234 567.8") 
print ('anonymous login allowed. ') 
exoept: 
print ('anonymous login denied. ') 


9.3 Bid RETE IPLE m 
931 网 页 内 容 读 取 与 域名 分 析 


Python 3. x 标准 库 urllib 提供 了 urllib. request、 urllib. response、 urllib. parse 和 
urllib. error 4 个 模块 ,很 好 地 支持 了 网 页 内 容 读 取 功 能 。 
下 面 的 代码 演示 了 如 何 读 取 并 显示 指定 网 页 的 内 容 。 


>>> inport urllib.request 
»»»fp-urllib.request.urlopen (r'http://www.python.org') 
>>>print (fp. read (100) ) 

>>>print (fp. read (100) .decode ()) 

>>> fp.close() 


下 面 的 代码 演示 了 如 何 使 用 GET 方法 读 取 并 显示 指定 URL 的 内 容 。 


»»»import urllib.request 
>>> import urllib.parse 
»»» params= urllib.parse.urlencode(('spam': 1, 'eggs': 2，'"bacon': 0]) 
>>> Url= "http://www.musi- cal .oav/agi- bin/query? $s" $params 
»»»with urllib.reguest.urlopen (url)as f: 

print (f.read() .decode ('utf- 8')) 


下 面 的 代码 演示 了 如 何 使 用 POST 方法 提交 参数 并 读 取 指 定 页 面 内 容 。 
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>>> inport urllib.request 

>>> inport urllib.parse 

>>> data-urllib.parse.urlencode (('spam': 1, 'eggs': 2, "bacon": 0}) 

>>> data data.encode ('ascii') 

>>> with urllib.request.urlcpen ("http://requestb. in/xrbl82xr", data)as f: 
print (£.read() .decode ('ut£- 8')) 


下 面 的 代码 演示 了 如 何 使 用 HTTP 代理 访问 指定 页 面 。 


>>> inport urllib.request 

»»»proxies- ('http': 'http://proxy.example.com:8080/" } 

>>> opener- urllib.request.FancyURLopener (proxies) 

>> > with cpener.cpen (http: //ww.python.org")as f: 
f.read() .decode ('ut£- 8') 


另外 ,Python 标准 库 webbrowser 支持 使 用 已 安装 的 浏览 器 直接 打开 网 页 。 可 以 在 


命令 提示 符 环境 中 执行 下 面 的 命令 : 


python -m webbrowser - t "http://www.python.org" 

也 可 以 在 IDLE 或 者 Python 程序 中 使 用 下 面 的 代码 调用 浏览 器 打开 指定 网 页 : 
import webbrowser 

webbrowser .cpen (http: //www.python.org') 


最 后 ,标准 库 urllib. parse 提供 了 域名 解析 的 功能 ,支持 URL 的 拆 分 与 合并 以 及 相 


对 地 址 到 绝对 地 址 的 转换 。 


>>> frm urllib.parse import urlparse 

>>> œurlparse ('http://www.cwi .n1:80/%7Eguido/Python.html ') 

»»»0.port 

80 

>>> o.hostname 

'ww.cwi.nl' 

>>> urlparse ('//www.cwi .n1:80/$ 7Eguido/Pythcn.html ' 

ParseResult (scheme- '', netloc- 'www.cwi.nl:80', path= '/$7Eguido/Python.html', params- '', query- '', 
fragnent- '') 

»»»urlparse ('www.cwi .n1/$ 7Eguido/Python.html ' 

ParseResult (scheme- '', netloc- '', path= 'www.cwi.nl/* 7Eguido/Python.html', params- '', query- '', 
fragrent- '') 

>>> frm urllib.parse import urljoin 

»»»urljoin('http://ww.cwi .nl/$7Eguido/Python.html', 'FAQ.html ') 
'http://ww.cwi n1/$ 7Eguido/E2Q.html ' 

»»»urljoin('http://wwr.cwi .n1/$ 7Eguido/Python.html ' , ' //wmw.python.org/$ TEguido') 

"http://www .python.org/$ TEguido" 

»»» fra urllib.parse import urlsplit 
»»»url-r'https://docs.python.org/3/library/urllib.parse.html ' 
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>>>rl=urlşplit (url) 

>>> rl.hostname 

>>>rl.gturl () 

"https://docs.python.org/3/library/urllib.parse.html ' 

»»»rl.netloc 

»»»rl.scheme 

ios 

QARAR: 如 果 你 仍然 不 舍得 放弃 Python 2. x, 或 许可 以 试 试 Python 扩展 库 
machanize, 这 也 是 一 款 不 错 的 网 页 内 容 读 取 工 具 。 


>> > import mechanize 

>> > browser- mechani ze.Browser () 

>> > page= browser .open (r 'http:/ /www.python.org' ) 
>>> source code- page.read() 

»»»print source code 


932 网 页 爬虫 


网 页 怜 虫 常用 来 在 互联 网 上 疏 取 感 兴趣 的 页 面 或 文件 ,结合 数据 处 理 与 分 析 技 术 可 
以 得 到 更 深层 次 的 信息 。 下 面 的 代码 实现 了 网 页 疏 虫 ,可 以 抓 取 指定 网 页 中 的 所 有 链接 ， 
并 且 可 以 指定 关键 字 和 抓 取 深度 。 

例 9-5 RE UmgT. 

import sys 

import re 

import os 

import urllib.request as lib 


def craw links(url, depth, keywords, processed): 
'"'url:the url to craw 
depth:the current depth to craw 
keywords:the tuple of keywords to focus 
pool:prooess pool 


contents- [] 
if url.startswith(('http://', 'https://*)): 
if url not in processed: 
"mark this url as processed 
prooessed.append (url) 
else: 
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#avoid processing the same url again 

retum 
print('Crawing '+url+ "+ ') 
fp- lib.urlcpen (url) 
#Python3 returns bytes, so need to decode 
contents- fp.read() 
contents decoded- contents.decode ('UTF- 8') 
fp.close() 
pattern- ' | ' join (keywords) 
fif this page contains certain keywords, save it to a file 
flag- False 
if pattern: 

searched- re.search(pattern, contents decoded) 
else: 

Tif the keywords to filter is not given, save current page 

flag- True 
if flag or searched: 

with cpen('crawNN * url.replace(':',' ').replace('/'," '), "wb') 

as fp: 
fp.write (contents) 

#find all the links in the current page 
links- re.findall ('href£- "(. * 2)"', contents decoded) 
#craw all links in the current page 
for link in links: 

#consider the relative path 

if not link.startswith ( ("http://', '"https://")) : 

try: 
index- url.rindex('/") 
link- url[0:index* 1]* link 


pass 
if depth» 0 and link.endswith((' .htm' , '.html ')) : 
craw links(link, depth- 1, keywords, processed) 


keywords = ('datetime', 'KeyWord?") 
if not os.path.exists ('craw')or not os.path.isdir('craw'): 
os mkdir ('craw') 
craw links (r'https://docs.python.org/3/library/index.html', 1, keywords, 
processed) 


933 scrapy 框架 
scrapy( 注 意 ,不 是 scapy) 是 一 个 非常 好 用 的 Web 息 虫 框架 ,非常 适合 抓 取 Web 站 
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点 从 网 页 中 提取 结构 化 的 数据 ,并 且 支 持 自 定义 需求 。 在 使 用 scrapy NE A GUB. 
除了 熟悉 HTML 标签 ,还 需要 了 解 目 标 网 页 的 数据 组 织 结构 ,确定 要 的 取 什 么 信息 ,这 
样 才能 有 针对 性 地 编写 疏 虫 程序 。 


使 用 pip 命令 安装 好 scrapy 之 后 ,在 命令 提示 符 环境 中 执行 下 面 的 命令 创建 一 个 项 
H MyCraw: 


scrapy startproject MyCraw 
然后 编写 Python 程序 MyCrawMMyCrawNspidersMMySpider. py . Fl T 85 18 4E 9i ifii 
的 内 容 , 把 网 页 内 容 和 图 片 分 别 保存 为 文件 ,代码 如 下 : 


import os 
import scrapy 


class MySpider (scrapy. spiders.Spider): 
SR E 45 57,831 RO Ho BUR AS REO 
name 'mySpider* 
allowed dcmains- ['www.sdibt.edu.cn'] 
FREER D GE s TT A LIE P Sé, RT ULL o URL 
start urls- ['http://www.sdibt .edu.cn/info/1026/11238.htm'] 


PIREA EIC 9 1, A H FA A 
def parse (self, response) : 
self.downloadWebpage (response) 
self.downloadlmages (response) 


His UI rp AO 8 b Be Jf DE e RC 
hxs- scrapy.Selector (response) 
sites-hxs.xpath (' //u1/1i') 
for site in sites: 
link- site.xpath ('a/8 hre£') „extract () [0] 
if link =='#': 
continue 
# 把 相对 地 址 转换 成 绝对 地 址 
elif link.startswith('.."): 
next url- os.path.dirname (response.url) 
next url +='/'+ link 
else: 
next url- link 
# 生 成 Request 对 象 , 并 指定 回调 函数 
yield scrapy.Reguest (url- next url, callback- self.parse item) 


# 回 调 函 数 ,对 起 始 页 面 中 的 每 个 超 链接 起 作用 
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s 


def parse item(self, response): 
self.downloadWebpage (response) 
self.downloadImages (response) 


# 下 载 当前 页 面 中 的 所 有 图 片 
def downloadlmages (self, response): 
hxs- scrapy. Selector (response) 
images hxs.xpath (' //img/8 src') „extract () 
for image url in images: 
imegeFilename- image url.split('/") [- 1] 
if os.path.exists (imageFi lename) : 
continue 
# 把 相对 地 址 转换 成 绝对 地 址 
if image url.startswith('.."): 
img url- os.path.dirname (response.url)* '/'+ image url 
# 打 开 网 页 图 片 
fp-urllib.request.urlopen (image url) 
# 创 建 本 地 图 片 文 件 
with open (imageFi lename, 'wb')as f: 
f.write (fp.read()) 
fp.close() 


# 把 网 页 内 容 保 存 为 本 地 文件 
def downloadWebpage (self, response): 
filename- response.ur1.split ('/') [- 1] 
with open(filename, 'wb')as f: 
f.write (response.body) 


ice fe áp A WE VERRE TP UT Fifi f iJ 22 R6 rho EE FE JF s ROBUR 


Scrapy crawl mySpider 


934 Beautiful Soup4 


BeautifulSoup 是 一 个 非常 优秀 的 Python 扩展 库 , 可 以 用 来 从 HTML 或 XML 文件 
中 提取 我 们 感 兴趣 的 数据 ,并 且 人 允许 指定 使 用 不 同 的 解析 器 。 由 于 beautifulsoup3 已 经 
不 再 继续 维护 ,新 的 项 目 中 应 使 用 beautifulsoup4 ,目前 最 新 版 本 是 4. 5.0, 可 以 使 用 pip 
install beautifulsoup4 直接 进行 安装 ,安装 之 后 应 使 用 from bs4 import BeautifulSoup 导 
入 并 使 用 。 下 面 我 们 就 一 起 来 简单 看 一 下 BeautifulSoup4 的 强大 功能 ,更 加 详细 完整 的 
学 习 资料 请 参考 https://www. crummy. com/software/BeautifulSoup/bs4/doc/。 


>>> BeautifulSoup('hello world!', 'lxml') # 自 动 添加 和 补 全 标签 
<html> < body» < p» hello world!« /p» < /body» < /html> 
»»»html doo- "" 


第 9 章 ”网络 应 用 开发 E 319 
b 


<html> <head> < title» The Dormpuse's story< /title> < /head» 
«body» 
«p class= "title"» «b» The Dormuse's story< /b» « /p> 


«p class= "story"> Once upon a time there were three little sisters; and their names were 
<a href= "http://example.can/elsie" class= "sister" id= "linkl"> Elsie« /a» , 

<a href= "http: //example.oan/lacie" class- "sister" id= "link2"> Iacie« /a> and 

<a href= "http://example.oav/tillie" class- "sister" id= "link3"> Ti llie« /a> ; 

and they lived at the bottam of a well.« /p> 


«p class- "story'» ***« /p> 
>>> fran bs4 import BeautifulSoup 
»»»soup-BeautifulSoup(html doc, 'html.parser') # 也 可 以 使 用 lml 或 其 他 解析 器 
»»» print (soup.prettify ()) # 以 优雅 的 方式 显示 出 来 
«html» 
<head> 
«title» 
The Dormpuse's story 
« /title» 
< /head> 
< body> 
<p class= "title"> 
«p 
The Dormouse's story 
«fb» 
< 
<p class "story"> 
Once upon a time there were three little sisters; and their names were 
«a class= "sister" href= "http: //example.con/elsie" id- "linkl"» 
Elsie 
«/a» 
«a class= "sister" href= "http: //example.com/lacie" id- "link2"» 
lacie 
« /a» 
and 
«a class= "sister" href= "http: //example.con/tillie" id- "link3"> 
Tillie 
« /a» 
and they lived at the bottam of a well. 
< 
<p class= "story"> 
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«po 

< /body> 
< /html» 
»»»sop.title # 访 问 特 定 的 标签 
«title» The Dormouse's story< /title» 
>>> soup.title.name # 标 签名 字 

"title" 
>>> soup.title.text # 标 签 文本 
"The Dormouse's story" 
>>> soup.title.string 
"The Dormouse's story" 
>>> sop.title.parent # 上 一 级 标签 
<head> < title» The Dormouse's story« /title> < /head» 
>>> soup.head 
X head» < title» The Dormouse's story« /title> < /head» 
>>> soup.b 
«b» The Domouse's story< /b> 
>>> soup.body.b 
«b» The Domouse's story< /b> 
>>> soup.name # 把 整个 Beautifulscup 对 象 看 作 标签 对 象 
' [document] " 
>>> soup.body 
<body> 
<p class= "title"> <b> The Donmuse's story< /b» < /p> 
<p class= "story"> Once upon a time there were three little sisters; and their names were 
«a class= "sister" href- "http://examle.omvelsie" id "linkl"» Elsie« /a» , 
«a class= "sister" href= "http://examle.omavlacie" id= "link?"» Lacie« /a> and 
«a class= "sister" href- "http://examle.omvtillie" id- "link3"» Tillie< /a» ; 
and they lived at the bottam of a well.« /p» 
<p class- "story'5 …< /p> 
< /body> 
>>> soup.p 
«p class= "title"> «b» The Dormouse's story< /b>< /p> 

»»»som.p['class'] # 标 签 属性 

['title'] 

>>> soup.p.get ('class') # 也 可 以 这 样 查看 标签 属性 
['title'] 

>>> soup.p.text 

"The Dormouse's story" 

>>> Soup.p.contents 

[< b> The Dormouse's story< /b> ] 
>>> soup.a 
«a class= "sister" href= "http://exanple.om/elsie" id- "linkl"» Elsie« /a> 
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>>> sap.a.attrs # 查 看 标签 所 有 属性 
{'class': ['sister'], "href': "http://example.conVelsie', "id': 'Linkl'} 
>>> soup.find all ('a') HERMA <o ME 


[<a class= "sister" href= "http://example.con/elsie" id="linkl"> Elsie« /a» , < a class= "sister" href 
— "http://example. ocn/lacie" id- "link2"» Iacie« /a>, « a class- "sister" href= "http://example. ca/ 
tillie" id "link3"> Tillie< /a» ] 

»»»sop.find all(['a', 'b']) # 同 时 查找 <a> 和 <b> 标 签 

[«b» The Domouse's story« /b» , «a class= "sister" href= "http: //example.con/elsie" id- "linkl"» Elsie 
« /a» , «a class= "sister" href= "http://example.coam/lacie" id- "link?"» Iacie« /a» , <a class= "sister" 
href= "http://example.ccn/tillie" id- "link3"» Tillie« /a> ] 
>>> inport re 
>>> soup.find all href= re.ompile ("elsie")) HER href 包 含 特定 关键 字 的 标签 

[<a class= "sister" href= "http://exanrple.cm/elsie" id- "linkl"» Elsie« /a» ] 
>>> som.find(id- 'link3!) 

«a class= "sister" href- "http://examle.caw/tillie" id- "link3"» Tillie« /a> 
>>> soup.find all('a', id 'link3') 

[<a class= "sister" href= "http://exanple.om/tillie" id- "link3"» Tillie< /a> ] 
>>> for link in sap.find all ('a'): 

print (link.text, ' :' , link.get ('href')) 


Elsie : http://example.com/elsie 
Iacie : http://example.omvlacie 
Tillie : http://example.omn/tillie 
»»»print(soup.get text()) # 返 回 所 有 文本 
The Dormpuse"'s story 
The Dormouse's story 
Once upon a time there were three little sisters; and their names were 
Elsie, 
Iacie and 
Tillie; 
and they lived at the bottom of a well. 
>>> som.a['id']- 'test linkl' # 修 改 标签 属性 的 值 
>>> soup.a 
«a class= "sister" href- "http://example.ca/elsie" id- "test linkl">Elsiec /a> 
>> > soup.a.string.replace with('test Elsie') # 修 改 标签 文本 
'"Elsie" 
>>> soup.a.string 
"test Elsie' 
»»» print (soup.prettify ()) 
«html» 
«head» 
«title» 
The Dormouse's story 
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</title> 
< /head> 
< body> 
<p class= "title"> 
«n» 
The Dormouse's story 
«^h» 
«p 
<p class= "story'» 
Once upon a tire there were three little sisters; and their names were 
«a class= "sister" href- "http: //example.oav/elsie" id- "test linkl"» 
test Elsie 
« fa» 
<a class- "sister" href= "http: //example.com/lacie" id= "link?"» 
Iacie 
</a> 
and 
<a class= "sister" href- "http: //example.ca/tillie" id- "link3"» 
Tillie 
« /a» 
and they lived at the bottam of a well. 
«po 
<p class= "story" 
«po 
< /body» 
</htbm> 
>>> for child in soup.body.children: # 饥 历 直接 子 标签 
print (child) 


«p class- "title"> <b> The Dompuse's story< /b» « /p> 


<p class= "story'"» Once upon a time there were three little sisters; and their names were 
«a class= "sister" href= "http://example.omvelsie" id- "test linkl"» test Flsie< /a>, 
«a class= "sister" href= "http://example.can/lacie" id= "link?" Lacie« /a> and 

«a class= "sister" href= "http://example.cam/tillie" id- "ink3"> Tillie< /a» ; 


and they lived at the bottom of a well.« /p> 
<p class= "story"> "< /p> 


>>> for string in soup.strings: # 人 遍历 所 有 文本 ,结果 略 


Print (string) 


>>>test_doc= '<html> <head> < /head> < body> < p» < /p» < p» < /p» < /body» < /heml» ' 


»»»s-BeautifulSoup(test doc, "bml') 
>>> for child in s.html children: SREBHECTARAE 
print (child) 
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X head» < /head» 

<body> « p» « /p» <p>< /p» < /body» 

>>> for child in s.html descendants: # 遍 历 子 孙 标 签 
print (child) 


X head» < /head» 

X body» « p» € /p» « p» < /p> < /body» 
«p»«/p» 

«p «/p 


9.4 网 站 开发 
941 使 用 NS 运行 thon Oa 程序 


在 Windows 平台 上 ,为 了 使 TIS 能 够 运行 Python 程序 ,需要 完成 以 下 几 步 设置 (以 
Win 7 旗舰 版 为 例 ) 。 

CD 依次 打开 “开始 ”一 “控制 面板 ”一 “管理 工具 ”一 “Internet 信息 服务 (IIS) 管 理 
器 ”, 右 击 “ 网 站 ”, 新 建 网 站 并 填写 网 站 基本 信息 ,如 图 9-4 所 示 。 


CAPython 3.5\WebSite 
传递 身份 验证 


[seo] [mance | 


P 
aem TP 地 址 中: #00): 
http. BET ~ 8080 


主机 名 (H): 


示例 : www.contoso.com 或 marketing.contoso.com 
[V] 立即 启动 网 站 (M) 
(Cm om D 


9-4 fr IIS 中 创建 网 站 


(2) 选择 刚 创 建 的 Python 网 站 ,在 右 侧 窗 口中 选择 * 处 理 程序 映射 ,然后 在 打开 的 
窗口 中 右 侧 单 击 “ 添 加 脚本 映射 ”, 在 弹出 的 窗口 中 填写 信息 ,如 图 9-5 所 示 。 


(3) 编写 Python 程序 文件 index. py, 并 放置 到 刚刚 创建 的 网 站 根 目录 中 。 代 码 
如 下 : 
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s 


TERE | z) 


ERREP): 

"py 

示例 : *.bas, wsvc.axd. 

可 执行 文件 (E): 

CAPython35Wython.exe 96s 96s - 


图 9-5 配置 IIS 的 程序 映射 


print('Status: 200 CK") 
print('Content- type: text/html ') 
print('*) 
header- '''« head runat- "server" 

«title < 人 title> 

< script language- "javascript" type= "text/javascript"» 
// < V[CDATA[ 


function Button2 onclick()( 
alert (Textl.value); 
) 


// ]]> 
</script> 
< /head> ' 
print (header) 
print ('« hl» This is a header« /hl> ') 
print('« input id= "Textl" type="text" /> ') 
button- '''« input id= "Button?" type= "button" value= "button" 
onclick- "return Button2 onclick()"/» ''' 
print (button) 
print ('< p» note:this is only a test.« /p> ') 


(4) 选择 上 面 创建 的 Python 网 站 , 单 击 右 侧 窗口 中 的 “默认 文档 ”, 然 后 添加 
index. py。 

(5) 打开 浏览 器 并 输入 刚才 配置 的 网 址 ,浏览 创建 的 网 站 ,如 图 9-6 所 示 。 在 网 页 中 
的 文本 框 内 输入 内 容 以 后 , 单 击 右 侧 的 按钮 ,可 以 弹出 网 页 信息 提示 输入 的 内 容 。 
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€ > QC D localhost:8080 


This is a header 
[button | 
note:this is only a test. 


9-6 ”网 站 运行 效果 (一 ) 


942 Python 在 ASPNET 中 的 应 用 


IronPython 插件 使 得 可 以 在 ASP. NET 网 站 中 使 用 Python 代码 ,不 过 目前 只 支持 
Python 2. 7. x, 暂 时 还 不 支持 Python 3. x。 下 面 以 Visual Sutdio 2008 和 Visual Studio 
2010 两 个 版 本 为 例 介绍 如 何在 ASP. NET/C # 网 站 中 使 用 Python 代码 ,Visual Studio 
2015 中 已 经 内 置 支持 Python, KAIR. 


1. C£ 2008 结合 Python FË ASP. NET 网 站 


(D 创建 Web Site, 并 添加 IronPython. dll 和 Micrsoft. Scripting. dll 两 个 引用 。 
(2) 编写 Python 程序 文件 demo. py, 并 放置 到 网 站 根 目录 中 ,内 容 如 下 : 


def demo (a) : 

return a.split(',') 

(3) 在 默认 页 面 文件 Default. aspx. cs 中 添加 命名 空间 IronPython. Hosting 和 
Microsoft. Scripting. Hosting。 

(4) 在 默认 Web 页 面 Default. aspx 中 放置 一 个 按钮 和 下 拉 列 表 框 , 然 后 在 按钮 的 单 
击 事件 处 理 函数 中 添加 如 下 代码 : 


var engine- Python.CreateEngine () ; 

var scope- engine.CreateSocpe () ; 

var source- engine.CreateScriptSourceFramFile (Server .MapPath ("~ ") - "A \demo.py") ; 

Source.Execute (scope) ; 

# 获 取 Python 程序 文件 中 的 函数 

var demo- socpe.GetVariable« Func« cbject，cbject> > ("demo"); 

# 调 用 Python 程序 文件 中 的 函数 

DropDownList1.DataSource- demo ("a, b, c, d, e") ; 

DropDownListl.DataBind() ; 

(5) 运行 网 站 ,初始 时 下 拉 列 表 框 中 没有 任何 可 选项 , 单 击 按钮 为 下 拉 列 表 框 添加 几 
个 英文 字母 的 可 选项 ,如 图 9-7 所 示 。 


2. CX 2010 结合 Python 开发 ASP. NET 网 站 


Visual Studio 2010 的 C & 4.0 提供 了 一 个 新 的 关键 字 dynamic, 大 幅度 方便 了 C 8 
与 Python 语言 的 混合 编程 。 
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C à m hp) 


sn 


9-7 网 站 运行 效果 (二 ) 


在 Visual Studio 2010 中 创建 Web Site, 添 加 按钮 和 下 拉 列 表 框 ,添加 引用 (选择 
ASP. NET 4. 0 版 本 , 在 IronPython 的 安装 目录 下 ) IronPython. dll 和 Micrsoft. 
Scripting. dll ,添加 命名 空间 IronPython. Hosting 和 Microsoft. Scripting. Hosting ,编写 
并 添加 demo. py 文件 ,与 Visual Studio 2008 中 的 操作 步骤 一 样 ,然后 在 按钮 的 单 击 事件 
处 理 函数 中 添加 如 下 代码 : 


ScriptRuntime pyRuntime- Python.CreateRuntime () ; 

dynamic dbj- pyRuntime.UseFi le (Server .MapPath ("~ ") - "\ Ndemo.py") ; 
# 调 用 Python 程 序 文件 中 的 函数 
DropDownListl.DataScurce- obj .Spl it ("a,b,c,d,e") ; 
DropDownListl.DataBind(); 


运行 网 站 , 单 击 按钮 ,运行 效果 与 图 9-7 相同 。 
3. 在 ASP. NET 网 站 中 使 用 CH Python 混合 处 理 数据 


以 Visual Studio 2010 为 例 ,假设 有 Access 数据 库 db5. mdb, 表 名 为 test, 第 一 个 字 
段 为 整数 类 型 。 创 建 ASP. NET 新 页 面 ,放置 一 个 按钮 ,在 其 Click 事件 中 编写 代码 : 


string connectionString- 8 "Provider- Microsoft.Jet.OLEDB.4.0;Data Source- "+ Server.MapPath ("^ ")+ @ "\ 
App DataVdo5.mcb"; 

OlerbConnection conn- new OlerbConnection () ; 
conn.ConnectionString- oonnectionString; 

string sql= "SELECT * FROM test"; 

OleDbDataAdapter adapter- new OleDbDataAdapter (sql, conn); 

DataSet ds- new DataSet () ; 

adapter.Fill (ds); 

ScriptRuntime pyRunt.ime- Python.CreateRuntime () ; 

dynamic dbj- pyRuntime.UseFi le (Server .MapPath ("~ ") - "\ Ndemo.py") ; 
Buttonl.Text- œj .demol (ds. Tables [0] .Rows) .ToString() ; 


上 面 代码 从 Access 数据 库 db5. mdb 中 test 表 查 询 所 有 数据 ,将 返回 的 所 有 数据 行 
传递 给 Python 程序 中 的 函数 demol() 。 编 写 demo. py 文件 并 放 在 网 站 根 目 录 中 ,代码 
如 下 : 


def dol (v): 
return v[0] [0]+ v[1] [0] 
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运行 网 站 并 单 击 按钮 后 按钮 文字 变 为 test 数据 表 中 前 两 列 第 一 个 字段 数字 之 和 。 


943 Rask 框 架 简单 应 用 


Flask 是 Python 社区 比较 主流 的 Web 框架 之 一 ,可 以 使 用 pip 工具 安装 Flask 框架 
及 其 扩展 包 。 
例 9-6 使 用 Flask 框架 编写 网 站 程序 。 


fram flask import Flask 


app-Flask( meme ) 
@ app.route ("/") 
def hello(): 
return "Hello World!" 


if nme  --" main ": 


app.run() 


将 代码 保存 为 flask_test. py 并 运行 ,在 IDLE 中 显示 网 站 已 启动 ,如 图 9-8 所 示 。 
使 用 浏览 器 打开 网 址 http://127. 0. 0. 1:5000, 显 示 文 本 “Hello World!”, 如 图 9-9 
所 示 。 


T: Ct Prem 3. 8/flask test, py z=====: L [8 npwazzoolsooo 


m 
* Running on http://127. 0. 0. 1:8000/ (Press CTRL4C t 
12.0.0. 1^- - [26/Dec/2015 18:41:41] "CET / HTTP/1. 1° 200 - Hello World! 


图 9-8 网 站 启动 界面 (三 ) 图 9-9 网 站 运行 效果 (四 ) 


例 9-7 Python 十 Flask 十 flask-email 发 送 带 附 件 的 电子 邮件 。 
运行 下 面 的 程序 之 前 ,需要 使 用 pip install flask-mail 安装 电子 邮件 扩展 包 。 


import os.path 
fram flask import Flask 
fram flask.ext.mail import Mail, Message 


app-Flask( name ) 

# 以 126 免 费 邮箱 为 例 

app.config['MRIL SERVER']- 'smtp.126.ccm' 

app.config['MATL PORT']= 25 

app.config['MAIL USE TLS']- True 

# 如 果 电 子 邮箱 地 址 是 abode 126.com 那 么 应 填写 abod 
app-config['MRIL USERNAME']= 'your own username of your email' 
app.config['MATL PASSWORD']- 'your own password of the username" 


def sendmail (Fram, To, Subject, Body, Html, Attachments): 
''"Tomust be a list'"" 
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msg-Message (Subject, sender- Fram, recipients- To) 
msg.body= Body 
msg.html= Html 
for f in Attachments: 
with app.open rescurce(f)as fp: 
msg.attach(filename- os.path.basename (f), data= fp.read(), 
content type- 'application/octet- stream!) 


if nme --' main "': 
#FErom 填 写 的 电子 邮箱 地 址 必须 与 前 面 配置 的 相同 
Frar '< your email address» ' 
# 这 是 我 本 人 的 如 邮箱 ,大 家 测试 的 时 候 一 定 要 修改 一 下 啊 
To- ['« 3064673558 qH.com> '] 
Subject- 'hello world' 
Body- 'Only a test." 
Html- '« hD test test test.« /hl» ' 
Attachments = ['c:\ \python35\ \python.exe"] 
sendmail (Fram, To, Subject, Body, Html, Attachments) 


944 dango 框架 简单 应 用 


django 是 非常 成 熟 的 Web 框架 ,采用 经 典 的 MVC 模式 ,支持 使 用 pip 工具 安装 。 安 
装 成 功 之 后 ,在 Python 安装 目录 中 的 scripts 文件 夹 中 有 个 文件 django-admin. py, 这 是 
用 来 创建 和 管理 Web 应 用 的 重要 程序 。 

例 9-8 创建 第 一 个 django Web 应 用 。 

在 命令 提示 符 环境 中 使 用 下 面 的 命令 创建 一 个 Web 应 用 first django: 

python django- admin.PY startproject first django 

如 果 这 个 命令 执行 成 功 (一 般 都 会 执行 成 功 ,如 果 不 成 功 的 话 , 很 可 能 是 django 安装 
不 成 功 或 者 Web 应 用 的 名 字 有 冲突 ), 会 在 当前 文件 夹 中 创建 一 个 子 文件 夹 first_ 
django。 

在 first_django\first_django 文件 夹 中 创建 一 个 Python 程序 view. py( 当 然 也 可 以 不 
叫 这 个 名 字 , 只 要 和 后 面 代码 中 一 致 就 可 以 了 ) ,内 容 如 下 : 


fram django.http import HttpResponse 


def hello (request) : 
return HttpResponse ("This is my first django application!') 


def greeting (request) : 


第 9 章 网 络 应 用 开发 â 329 
e 


return HttpResponse ('Hello everyone! ') 
然后 ,打开 文件 first. djangoMirst. djangoVurls. py, 修 改 其 中 的 代码 如 下 : 


fram django.conf.urls import url 


fron first django.view import hello, greeting # 这 里 wiew 对 应 刚才 创建 的 wew-py 文 件 
urlpatterns- [ # 建 立 URL 和 函数 的 对 应 关系 

url (r'^bello/', hello), # 第 一 个 参数 是 正则 表达 式 

url (r'^greeting/', greeting), # 第 二 个 参数 是 view.py 中 的 函数 


] 


好 了 ,一 个 简单 的 网 站 已 经 建 好 了 , 接 下 来 到 命令 提示 符 环境 中 执行 下 面 的 命令 启动 
这 个 网 站 ， 


python manage.py runserver 127.0.0.1:8000 


在 上 面 的 命令 中 ,127. 0.0. 1 表示 本 机 IP 地 址 ,当然 读者 可 以 修改 为 自己 计算 机 上 
配置 的 IP 地 址 ,8000 表示 这 个 网 站 使 用 的 端口 ,也 可 以 修改 为 其 他 的 端口 ,如 果 端 口 没 
有 冲突 的 话 , 会 出 现下 面 的 图 9-10 中 的 提示 ,表示 网 站 启动 成 功 了 。 最 后 可 以 使 用 浏览 
器 打开 网 址 http://127. 0. 0. 1: 8000/greeting/ 和 http://127. 0. 0. 1: 8000/hello/ 查 看 
效果 。 


:Python 3.55Scriptsfirst_django>..\N..\python manage.py runserver 127.9-9.1:89| 
[Performing system checks... 
System check identified no issues <B silenced). 


[ou have unapplied migrations; your app may not vork properly until they are app 
Lied. 
[Run "python manage.py migrate’ to apply them. 
y 07, 2016 - 16:51:07 
[Django version 1.8.6, using settings 'first django.settings" 
Starting development server at http://127.0.0.1:8000/ 
Quit the server vith CTRL-BRERK. 


9-10 启动 django 网 站 


LAMER: 当 修改 网 站 中 的 文件 时 ,不 需要 手工 重新 启动 网 站 ,django 会 自动 检查 
并 重启 服务 。 另 外 , 当 用 户 通过 浏览 器 访问 页 面 时 ,命令 提示 符 窗口 会 提示 相应 的 日 志 

例 9-9 素数 判断 。 

按照 上 例 的 步骤 ,首先 创建 网 站 django_IsPrime, 然 后 编写 Python 程序 文件 django_ 
IsPrime\django_IsPrime\view. py, 其 中 代码 如 下 : 


fram django.http import HttpResponse, Http404 
fram math import sqrt 


def isPrime(request, number): #mumiber 表 示 接 收 到 的 参数 
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if nmber ==2: #2 是 最 小 的 素数 


fori in mee, int (spt (rnber)+ 2)) : HIN mmber 是 否 为 素数 
if mmberi ==0: 
flag-' is not ' 
break 
else: 
txt= str (number) flagt ' a Prime" 
retum HttpResponse ('« hl» '4- txt* '« /hl> ') 


然后 修改 django IsPrimeMdjango IsPrimeVurls. py 文件 中 的 代码 为 


fram django.conf.urls import include, url 
fram django.contrib import admin 
frm django IsPrime.view import isPrime 


urlpatterns- [ #URL 与 函数 之 间 的 对 应 关系 
url (r'^admin/', include (admin.site.urls)), 
url (r'^isPrime/ Nd* )/$ ', isPrime), # 正 则 表达 式 , 提 取 数 字 参 数 


] 


然后 启动 网 站 ,在 浏览 器 中 输入 http://127. 0. 0. 1:8000/isPrime/91. f£ Enter 键 后 
查看 结果 ,如 图 9-11 Pros ,其 中 91 表示 要 判断 的 整数 ,读者 可 以 改 成 其 他 数字 进行 检验 。 


< > © (C Dm x htp//12700.18000/isPrime/91/ 
Li p MON 2 S MEME M 应 用 中 心 。 人 特权 中 心 


91 is not a Prime 
图 9-11 素数 判断 


例 9-10 使 用 网 页 模板 。 

使 用 网 页 模板 可 以 避免 重复 设计 网 页 布局 带 来 的 工作 量 , 有 效 利用 已 有 代码 ,保持 风 
格 的 一 致 性 。 按 前 面 的 步骤 ,首先 创建 网 站 django_template, 然 后 创建 文件 夹 django_ 
template\templates, 并 创建 网 页 模板 文件 django_template\templates\greeting. html, 其 
中 内 容 为 

«htm 

<body> 
«hl» Good {{moming afternoon evening}}, I am ((name]).« /hl> 
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< /body> 
« /ntml» 


其 中 ,两 对 大 括号 {{}} 中 的 内 容 为 变量 ,也 就 是 运行 时 要 替换 的 内 容 。 接 下 来 创建 
Python 程序 文件 django_template\django_template\view. py, 其 中 代码 为 


fram django.http import HttpResponse, Http404 
import datetime 

fram django import template 

from django.conf import settings 

import os 

import os.path 

fram randam import choice 


#settings.configure () 
names = ('Zhang san', 'Li si', Wang wu', 'Ma liu') 


def greeting (request) : 
templateFile- os.path.join (os.path.split (os.path.dimame ( — file — )) [0], "templates ') + '\\ 
greeting.html ' 

with open (templateFile)as fp: # 打 开 网 页 模板 文件 ,创建 模板 
t= template.Terplate (fp.read()) 

current name- choice (names) # 随 机 选择 一 个 问候 人 

h= datetime.datetime.now() .hour # 当 前 时 间 

if c-hc 12: # 上 午 
mae- 'Morning' 

elif 12« - h« 18: # 下 午 
mae- 'Afternoon" 

else: # 晚 上 
mae- 'Evening' 

con- temlate.Context (('name':current name, 'morning afternoon evening':mae]) 

html- t.render (con) # 泻 染 模 板 

retum HttpResponse (html) 


最 后 ,修改 django_template\django_template\urls. py 文件 如 下 : 


fram django.conf.urls import include, url 
fram django.contrib import admin 

fram django template.view import greeting 
urlpatterns- [ 


url (r'^adnin/', include (admin.site.urls)), 
url (r'^greeting/S ', greeting), 
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s 
好 了 ,网 站 设计 完了 ,把 上 面 所 有 文件 都 保持 到 正确 的 文件 夹 中 ,启动 网 站 ,然后 使 用 
浏览 器 访问 http://127. 0. 0. 1:8000/greeting/ ,多 刷新 几 次 ,会 看 到 网 页 上 的 问候 人 会 有 
所 变化 ,并 且 问 候 的 时 间 也 会 根据 当前 时 间 进 行 相应 的 变化 , 某 时 刻 的 运行 效果 如 
图 9-12 所 示 。 
€ > © (C UD | x htp//1270.0.:8000/greeting/ 
paa @| 上 网 导航 门 京东 高 城 Dp xex Damo Amro ft 


Good Morning, I am Zhang san. 
图 9-12 使 用 网 页 模板 


日 常生 活 中 我 们 每 天 都 在 不 知 不 觉 地 使 用 多 线程 和 多 进程 的 技术 来 安排 繁忙 的 事 
务 。 例 如 ,早上 6:20 起 床 后 , 先 把 牛奶 热 上 (启动 者 牛奶 进程 ) ,把 鸡蛋 者 上 (启动 者 鸡蛋 
进程 ), 烧 上 一 这 水 (启动 烧 水 进程), 然 后 开始 洗 激 并 等 待 牛 奶 或 鸡蛋 者 好 的 信号 (进程 同 
步 ) , 当 收 到 相应 的 信号 时 关闭 相应 的 电源 或 天 然 气 阀门 , 洗 激 结 束 后 洗 个 青菜 开始 炒 ,其 
间 如 果 已 到 达 6:50 则 叫 孩 子 起 床 洗 濑 吃饭 (又 启动 一 个 进程 )…… 如 果 这 些 任务 逐个 进 
行 ,完成 一 个 再 开始 下 一 个 ,时 间 根本 不 够 。 而 由 于 多 个 任务 同时 进行 ,大 大 提高 了 整体 
效率 。 

硬件 技术 的 发 展 速度 已 经 超越 了 “摩尔 定律 "的 限制 ,早期 的 多 核 ,多 处 理 器 这 些 高 大 
上 的 技术 已 经 走 进 了 普通 家 庭 , 再 加 上 内 存 、 主 频 、 硬 盘 等 各 种 硬件 配置 的 飞速 提高 ,大 幅 
度 提高 了 普通 PC 的 运算 速度 和 数据 处 理 能 力 , 甚 至 普通 手机 也 具有 了 四 核 以 上 的 处 理 
RAGB 以 上 的 运行 内 存 以 及 32GB 以 上 的 存储 卡 。 在 多 核 ,多 处 理 器 平台 上 ,在 任意 时 
刻 每 个 核 可 以 运行 一 个 线程 ,多 个 线程 同时 运行 并 相互 协作 ,从 而 达到 高 速 处 理 任务 的 目 
的 。 然 而 ,即使 是 高 端 服务 器 或 工作 站 甚至 集群 系统 ,处 理 器 和 核 的 数量 总 是 有 限 的 ,如 
果 线 程 的 数量 多 于 核 的 数量 ,就 必然 需要 进行 调度 。 在 调度 时 ,处 理 器 为 每 个 线程 分 配 一 
个 很 短 的 时 间 片 ,所 有 线程 根据 具体 的 调度 算法 轮流 获得 该 时 间 片 。 当 时 间 片 用 完 以 后 ， 
即使 该 线程 还 没有 执行 完 也 要 退出 处 理 器 并 等 待 下 次 调度 (也 就 是 说 , 一 个 线程 可 能 需要 
被 调度 并 执行 很 多 次 才 会 结束 ,图 10-1 中 椭圆 内 的 上 下 文 开关 次 数 反映 了 线程 被 调度 的 
次 数 ) ,同时 由 操作 系统 按照 优先 级 再 选择 一 个 线程 进入 CPU 运行 (多 处 理 器 的 调度 算 
法 更 加 复杂 ,可 以 参考 (操作 系统 ) 之 类 的 书籍 )。 由 于 处 理 器 中 寄存 器 的 数量 有 限 ,而 不 
同 的 线程 很 可 能 需要 使 用 到 相同 的 一 组 寄存 器 来 保存 中 间 计算 结果 或 当前 运行 状态 。 因 
此 ,在 调度 线程 时 必须 要 做 好 上 下 文保 存 和 恢复 工作 ,以 保证 该 线程 下 次 被 调度 进 处 理 器 
后 能 够 继续 上 次 的 工作 。 虽 然 这 些 工作 并 不 需要 Python 程序 员 操 心 ,但 是 我 们 必须 清 
楚 的 一 件 事 是 ,并 不 是 使 用 的 线程 数量 越 多 越 好 ,如 果 线 程 太 多 ,线程 调度 带 来 的 开销 可 
能 会 比 线程 实际 执行 的 开销 还 大 ,这 样 使 用 多 线程 就 失去 本 来 的 意义 了 。Python 多 线程 
编程 技术 存在 GIL 问题 ,而 使 用 多 进程 则 有 效 地 避免 了 这 个 问题 ,进一步 提高 了 系统 和 
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图 10-1 WPS 进程 中 某 个 线程 的 属性 


10.1 多 线程 编程 


磁盘 上 的 应 用 程序 文件 被 打开 并 执行 时 就 创建 了 一 个 进程 ,但 进程 是 “懒惰 "的 ,本 身 
并 不 是 可 执行 单元 ,从 来 不 执行 任何 东西 ,主要 是 线程 的 容器 。 要 使 进程 中 的 代码 真正 运 
行 起 来 ,必须 拥有 至 少 一 个 能 够 在 这 个 环境 中 运行 代码 的 执行 单元 ,就 是 线程 。 线 程 是 操 
作 系统 调度 和 分 配 处 理 器 时 间 的 基本 单位 ,负责 执行 包含 在 进程 地 址 空间 中 的 代码 。 当 
一 个 进程 被 创建 时 ,操作 系统 会 自动 为 之 建立 一 个 线程 ,通常 称 为 主线 程 。 一 个 进程 可 以 


寄存 器 环境 和 单独 的 堆栈 ,但 是 它们 共享 进程 的 地 址 空间 、 对 象 句柄 、` 代 码 数据 和 其 他 资 
pd 线程 总 是 在 基 个 进程 的 上 下 文中 被 创建 ， 并 且 会 在 这 个 进程 空间 中 ban aa T1 


JEU UG M RE ORO M EF REREDI. 般 来 说 并 不 会 感到 寂寞 ,同一 away 
线程 之 间 是 允许 进行 交流 的 (数据 共享 .同步 等 )。 另 外 ,一 般 来 说 , 除 主线 程 外 ,其 他 线程 
的 生命 周期 都 小 于 其 所 属 进程 的 生命 周期 。 

标准 库 threading 是 Python 支持 多 线程 编程 的 重要 模块 ,该 模块 是 在 底层 模块 <_ 
thread” 的 基础 上 开发 的 更 高 层次 的 线程 编程 接口 ,提供 了 大 量 的 方法 和 类 来 支持 多 线程 
编程 , 极 大 地 方便 了 用 户 。threading 模块 常用 方法 与 类 如 表 10-1 所 示 。 
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表 10-1 threading 模块 常用 方法 与 类 


方法 /类 功能 说 明 


active_count() ,activeCount() 返回 当前 处 于 alive 状态 的 Thread 对 象 数量 


current_thread() ,currentThreadO) | 返回 当前 Thread 对 象 


返回 当前 线程 的 线程 标识 符 。 线 程 标识 符 是 一 个 非 负 整数 ,并 


threading. get_ident() 没有 特殊 含义 ,只 是 用 来 标识 线程 ,该 整数 可 能 会 被 循环 利用 。 
Python 3. 3 及 以 后 版 本 支持 该 方法 
threading. enumerate() 返回 当前 处 于 alive 状态 的 所 有 Thread 对 象 列 表 


返回 主线 程 对 象 , 即 启动 Python 解释 器 的 线程 对 象 。Python 
3.4 及 以 后 版 本 支持 该 方法 


threading. main_thread() 


返回 创建 线程 时 使 用 的 栈 的 大 小 ,如 果 指 定 size 参数 , 则 用 来 指 


threading. stack_size([size]) 定 后 续 创 建 的 线程 使 用 的 栈 的 大 小 ,size 必须 是 0( 表 示 使 用 系 
统 默认 值 ) 或 大 于 32KCK 表示 1024) 的 正 整 数 

Thread 线程 类 ,用 于 创建 和 管理 线程 

Event 事件 类 ,用 于 线程 同步 

Condition 条 件 类 ,用 于 线程 同步 

Lock, RLock 锁 类 ,用 于 线程 同步 

Semaphore 信号 量 类 ,用 于 线程 同步 

Timer 用 于 在 指定 时 间 之 后 调用 一 个 函数 的 情况 


下 面 的 代码 简单 演示 了 该 模块 方法 的 用 法 : 


>>> inport threading 

>>> threading.stack size() # 查 看 当前 线程 栈 的 大 小 
0 

>>> threading.stack size(64* 1024) # 设 置 当 前 线程 栈 的 大 小 


0 
>>> threading.stack size() 


65536 
»»»threading.active count() # 查 看 活动 线程 数量 
»»»threading.current thread() # 返 回 当 前 线程 对 象 
«€ MainThread(MainThread, started 4852)> 
>>> threading.enumerate () # 枚 举 所 有 线程 
[< Thread (SockThread, started daemon 9620)>, <_MainThread MainThread, started 4852)» ] 
>>> def dep(v): 

print (v) 
»»»t-threading.Timer (3, demo, args= (5,)) # 创 建 线 程 
»»»t.start() # 启 动 线程 ,3s 之 后 调用 demo 函数 


>>>t.cancel () # 如 果 仍 在 等 待 时 间 到 达 , 则 取消 
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线程 创建 与 管理 


标准 库 threading 中 的 Thread 类 用 来 创建 和 管理 线程 对 象 ,支持 使 用 两 种 方法 来 创 
建 线程 : 直接 使 用 Thread 类 实例 化 一 个 线程 对 象 并 传递 一 个 可 调用 对 象 作为 参数 ; 
回 继承 Thread 类 并 在 派生 类 中 重 写 _init OM run() 方 法 。 创 建 了 线程 对 象 以 后 ,可 
以 调用 其 start() 方 法 来 启动 ,该 方法 自动 调用 该 类 对 象 的 run() 方 法 ,此 时 该 线程 处 于 
alive 状态 ,直至 线程 的 run() 方 法 运行 结束 。Thread 对 象 主要 成 员 如 表 10-2 所 示 。 


表 10-2 Thread 对 象 成 员 


成 B 说 明 

start() 自动 调用 run() 方 法 ,启动 线程 ,执行 线程 代码 

n 线程 代码 ,用 来 实现 线程 的 功能 与 业务 逻辑 ,可 以 在 子 类 
中 重 写 该 方法 来 自 定义 线程 的 行为 

__init__(self, group= None, target — 

None, name— None, args— O , kwargs | 构造 函数 

— None, verbose— None) 

name 用 来 读 取 或 设置 线程 的 名 字 

ident 线程 标识 , 非 0 数字 或 None( 线 程 未 被 启动 ) 

is aliveO \isAlive() 测试 线程 是 否 处 于 alive 状态 

daemon 布尔 值 ,表示 线程 是 否 为 守护 线程 

joinCtimeout— None) 等 待 线程 结束 或 超时 返回 


(D join([timeout])。 


阻塞 当前 线程 ,等 待 被 调 线程 结束 或 超时 后 再 继续 执行 当前 线程 的 后 续 代 码 ,参数 


timeout 用 来 指定 最 长 等 待 时 间 , 单 位 是 秒 。 
线程 对 象 的 join() 方 法 。 


例 10-1 


fram threading import Thread 
import time 


def funcl(x, y): 
fori in range (x, y): 
print, end-' ') 
print() 
time.sleep(10) 


tl- Thread(target- funcl, args- (15, 20)) 


tl.start() 
tl.join6) 


t2- Thread (target- func], args (5, 10)) 


t2.start() 


# 等 待 10s 


# 创 建 线程 对 象 ,args 是 传递 给 函数 的 参数 


# 启 动 线程 


# 等 待 线程 也 运行 结束 或 等 待 55 
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保存 并 运行 上 面 的 程序 ,首先 输出 15 至 19 这 5 个 整数 ,然后 程序 暂停 5s 以 后 又 继 
续 输 出 5 至 9 这 5 个 整数 。 如 果 把 tl.join(5) 这 一 行 注释 或 删除 之 后 再 次 运行 ,两 个 线程 
的 输出 将 会 重 又 在 一 起 ,这 是 因为 两 个 线程 并 发 运行 ,而 不 是 等 待 第 一 个 结束 以 后 再 运行 
第 二 个 。 如果 把 time. sleep(10) 这 一 行 注释 或 删除 再 运行 ,会 发 现 两 个 线程 的 输出 之 间 没 
有 时 间 间 隔 , 这 是 因为 线程 对 象 的 join() 方 法 当 线程 运行 结束 或 超时 之 后 返回 ,虽然 指定 
了 超时 时 间 为 5s ,而 实际 上 线程 函数 瞬间 就 执行 结束 了 。 

QARA: 以 创建 并 启动 线程 的 方式 来 执行 一 个 函数 可 以 实现 多 个 函数 或 功能 
代码 并 发 或 同时 运行 ,而 直接 调用 函数 的 话 会 阻塞 当前 线程 ,直到 函数 执行 结束 返回 后 才 
能 继续 执行 当前 线程 的 代码 。 

(QARAR: 前 面 我 们 已 经 多 次 用 过 Python 标准 库 time 中 的 sleep() 函 数 , 它 的 
功能 是 暂停 (或 者 说 阻塞 当前 线程 ) 指 定时 间 ( 单 位 是 秒 ) 。 从 多 线程 编程 和 调度 算法 上 来 
讲 ,该 函数 的 真正 功能 是 告诉 操作 系统 在 一 定 的 时 间 内 不 要 再 调度 自己 了 ,主动 把 时 间 片 
让 出 来 给 别 的 线程 。 也 就 是 说 ,虽然 系统 中 同时 会 存在 大 量 的 线程 ,但 是 由 于 优先 级 问题 
以 及 主动 阻塞 等 原因 ,真正 处 于 可 调度 状态 的 线程 数量 并 不 是 非常 多 ,系统 也 不 会 给 暂时 
没事 可 做 的 线程 分 配 CPU 时 间 。 

(2)isAlive() , 

这 个 方法 用 来 测试 线程 是 否 处 于 运行 状态 ,如 果 仍 在 运行 则 返回 True, 如 果 尚 未 启 
动 或 运行 已 结束 则 返回 False。 

例 10-2 线程 状态 检测 。 


def funcl(): 
time.sleep(10) 


tl= Thread (target- funcl) 
print('tl:',tl.isAlive()) 
tl.start() 


# 线 程 还 没有 运行 ,返回 False 


print ('t1:',tl.isAlive()) 
tl.join6) 
print ('t1:',tl.isAlive()) 
t1.join() 
print ('t1:',tl.isAlive()) 


上 面 程序 的 输出 结果 为 


tl: False 
tl: True 
tl: True 
tl: False 


(3) daemon 属性 。 


在 脚本 运行 过 程 中 有 一 个 主线 程 , 若 在 主线 程 中 创建 了 子 线程 ,当主 线程 结束 时 根据 


# 线 程 还 在 运行 ,返回 True 
#join() 方 法 因 超时 而 结束 
# 线 程 还 在 运行 ,返回 True 
# 等 待 线程 结束 

# 线 程 已 结束 ,返回 False 
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子 线程 daemon 属性 值 的 不 同 可 能 会 发 生 下 面 的 两 种 情况 之 一 。 

CD 如 果 某 个 子 线程 的 daemon 属性 为 False, 主 线程 结束 时 会 检测 该 子 线程 是 否 结 
东 , 如 果 该 子 线程 还 在 运行 , 则 主线 程 会 等 待 它 完成 后 再 退出 。 

@ 如 果 某 个 子 线程 的 daemon 属性 为 True. 主线 程 运行 结束 时 不 对 这 个 子 线程 进行 
检查 而 直接 退出 ,同时 所 有 daemon 值 为 True 的 子 线程 将 随 主 线程 一 起 结束 ,而 不 论 是 
和 否 运行 完成 。 

daemon 属性 的 值 默认 为 False, 如 果 需 要 修改 , 则 必须 在 调用 start() 方 法 启动 线程 
之 前 进行 设置 。 

以 上 论述 不 适用 于 IDLE 环境 中 的 交互 模式 或 脚本 运行 模式 ,因为 在 该 环境 中 的 主 
线程 只 有 在 退出 Python IDLE 时 才 终 止 。 

例 10-3 线程 对 象 的 daemon 属性 。 

ipet 

import time 


class mythread (threading. Thread) : HER Thread 类 ,创建 自 定义 线程 类 
def init (self, num, threadname): 
threading.Thread. init (self, name- threadname) 


Self.num- nun 


def run(self): # 重 写 run() 方 法 
time.sleep (self.num) 
print (self.num) 
tlemythread(l, 't1') # 创 建 自 定义 线程 类 对 象 ,daencn 默 认为 False 
t2-mythread(5, 't2") 
t2.daemon= True. # 设 置 线程 对 象 £2 00 daemon 属性 为 True 


print (t1.daemon) 

print (t2.daemon) 

tl.start () # 启 动 线程 
t2.start () 


把 上 面 的 代码 存储 为 ThreadDaemon. py 文件 ,在 IDLE 环境 中 运行 结果 如 图 10-2 
所 示 ,在 命令 提示 符 环境 中 运行 结果 如 图 10-3 所 示 。 可 以 看 到 ,在 命令 提示 符 环境 中 执 
行 该 程序 时 ,线程 t2 没有 执行 结束 就 跟随 主线 程 一 同 结 束 了 ,因此 并 没有 输出 数字 5。 


国 邻 人 提示 符 


:\Python35>python threaddaemon.py 
'alse 
rue 


u :\Python35> 


10-2 在 IDLE 环境 中 运行 10-3 在 命令 提示 符 环境 中 运行 


第 10 章 多 线程 与 多 进程 外 339 
e 


1012 线程 同步 技术 


俗话 说 ,人 多 力量 大 ,众人 拾 柴 火焰 高 。 一 般 情况 下 这 是 成 立 的 ,如 果 团 队 中 每 个 人 
都 能 够 互 不 干扰 地 工作 ,整体 效率 会 达到 最 佳 状态 。 但 这 在 实际 中 是 不 可 能 实现 的 , 随 着 
队伍 的 壮大 ,团队 成 员 之 间 需 要 协调 和 同步 才能 有 条 不 亲 地 完成 整个 任务 , 随 之 而 来 的 是 
多 人 合作 时 的 管理 和 沟通 代价 的 增加 ,而 当成 员 人 数 超过 一 定 阔 值 之 后 ,可 能 会 带 来 不 可 
估量 的 困难 。 另 外 ,如 果 多 人 使 用 同一 个 资源 ,就 更 需要 很 好 地 控制 对 资源 的 访问 。 例 
如 ,服装 店 里 的 试 衣 间 或 者 火车 上 的 了 卫生间, 里面 有 人 时 会 有 一 定 的 标记 ,里 面 没 人 时 下 
一 个 人 才 可 以 进入 并 使 用 。 多 线程 编程 也 是 同样 的 道理 ,不 仅 要 合理 控制 线程 数量 ,还 需 
要 在 多 个 线程 之 间 进 行 有 效 地 同步 和 调度 才能 发 挥 最 大 功效 。 

多 线程 的 主要 作用 之 一 是 为 了 充分 利用 硬件 资源 ,尤其 是 提高 CPU 的 利用 率 , 提 高 
系统 的 任务 处 理 速 度 和 吞吐 量 , 让 各 个 部 件 都 处 于 高 速 运转 和 忙碌 状态 。 把 任务 拆 分 成 
互相 协作 的 多 个 线程 同时 运行 ,那么 属于 同一 个 任务 的 多 个 线程 之 间 必 然 会 有 交互 和 同 
步 以 便 能 够 互相 协作 地 完成 任务 ,例如 ,使 用 多 线程 技术 从 网 络 上 下 载 文件 可 以 提高 整体 
下 载 速 度 , 但 需要 合理 安排 每 个 线程 负责 下 载 的 内 容 才 行 。 

(以 拓展 知识 : 多 线程 技术 的 提出 并 不 仅仅 是 为 了 提高 处 理 速 度 和 硬件 资源 利用 率 ， 
还 有 就 是 为 了 增加 系统 的 可 扩展 性 (采用 多 线程 技术 编写 的 代码 移植 到 多 处 理 器 平台 上 
继续 不 需要 改写 就 能 立刻 适应 新 的 平台 ) 和 提高 用 户 体验 。 对 于 单 核 CPU 计算 机 而 言 ， 
使 用 多 线程 并 不 能 提高 任务 完成 速度 ,但 有 些 场 合 必须 要 使 用 多 线程 技术 ,或 者 采用 多 线 
程 技 术 可 以 让 整个 系统 的 设计 更 加 人 性 化 。 例 如 ,在 执行 另 一 段 代码 的 同时 还 想 接收 用 
户 的 键盘 或 鼠标 事件 以 提高 用 户 体 验 , 这 时 候 就 只 能 以 线程 的 形式 来 运行 另 一 个 函数 的 
代码 。Windows 操作 系统 的 Windows Indexing Services 创建 了 一 个 低 优 先 级 的 线程 ,该 
线程 定期 被 唤醒 并 对 磁盘 上 的 特定 区 域 的 文件 内 容 进 行 索引 以 提高 用 户 搜 索 速 度 。 打 开 
Photoshop、3ds Max 这 样 的 大 型 软件 时 需要 加 载 很 多 模块 和 动态 链接 库 , 软 件 启动 时 间 
会 比较 长 。 这 时 候 可 以 使 用 一 个 线程 来 显示 一 个 小 动画 来 表示 当前 软件 正在 启动 ,而 当 
后 台 线程 加 载 完 所 有 的 模块 和 库 之 后 ,结束 该 动画 的 播放 并 打开 软件 主 界面 ,这 也 是 多 线 
程 同 步 的 一 个 典型 应 用 。 字 处 理 软件 可 以 使 用 一 个 优先 级 高 的 线程 来 接收 用 户 键盘 输 
入 ,而 使 用 一 些 低 优先 级 线程 来 进行 拼写 检查 、 语 法 检查 、 分 页 以 及 字数 统计 之 类 的 功能 
并 实时 将 结果 显示 在 状态 栏 上 ,这 无 疑 会 极 大 方便 用 户 的 使 用 ,对 于 提高 用 户 体验 有 重要 
帮助 。 图 10-4 展示 了 字 处 理 软件 WPS 启动 之 后 创建 的 部 分 线程 ,图 10-5 中 列 出 了 作者 
的 计算 机 上 某 个 时 刻 所 有 进程 拥有 的 线程 数量 。 


1. Lock/RLock Xj $& 


Lock 是 比较 低级 的 同步 原 语 , 当 被 锁定 以 后 不 属于 特定 的 线程 。 一 个 锁 有 两 种 状 
Æ: locked 和 unlocked。 如 果 锁 处 于 unlocked 状态 ,acquire() 方 法 将 其 修改 为 locked 并 
立即 返回 ;如 果 锁 已 处 于 locked 状态 , 则 阻塞 当前 线程 并 等 待 其 他 线程 释放 锁 , 然 后 将 其 
修改 为 locked 并 立即 返回 。release() 方 法 用 来 将 锁 的 状态 由 locked 修改 为 unlocked 并 
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d Microsoft Spy++ -1 


5-6 线程 000012BC WPS 
© 线程 00001B9C WPS 
© 线程 00001880 WPS 
© 线程 00001BC8 WPS 
$3? 00001BF0 WPS 


图 10-4 WPS 创建 的 部 分 线程 


Lisa] 进程 
BRER jRP& cu ARC. E 
360rp exe dfg 00  1359*0K 66 
360sd. exe dfg 00 1,256 K 23 
360tray. exe #32 dfg 00 28,196 K L4 
atieclxx. exe 00 1,680 K 10 
CBoxService. exe. dfg 00 5,012 K 13 
esrss. exe 00 2,352 K 12 
dwn. exe dfg 01 24,908 K 5 
explorer. exe. dfg o 25,800 K 3 
jusched exe 432 dfe 00 3,328 K 5 
ktpentr.exe 432 dfg 00 5,704 K 15 
kusipan exe 432 dfg 00 8,020 K 29 
QQ. exe *32 dfg 08 109, 428 K 64 
QQWGEWYebserver. dfg 00 3,000 K 13 
QQllusi cService. dfg 00 2,872 K 3 
QQFCNetFlow. exe. dfg 00 3,160 K 2T 
QQFCRealTineSpe. dfg 00 24,144 K 26 
QQFCTray. exe *32 dfg o 59,144 K 153 
SGCalendar.exe #32 dfg 00 7,740 K 12 
SoftNerLite, exe. dfg 00 3,204 K 6 
SogouCloud exe *32 dfg 00 7,844 K 21 
Spyxx_and54. exe dfg 00 4,872 K 3 
taskeng. exe dfg 00 1,912 K 5 
taskhost. exe dfg 00 2,3080 K 10 
taskngr. exe dfg o 2,900 K 6 
TXPlatform. exe #32 dfg 00 904 K 4 
WDCer th_CCB. exe. dfe 00 3,480 K 3 
winlogon. exe 00 2,308 K 3 
wps. exe *32 dfg 00 145,156 K 26 
wpscenter exe #32 dfg 00 6,272 K 32 
wpscloudsvr. exe. dfg 00 35,200 K 26 
Youkulledi aCente. dfe 00 453 K 20 


图 10-5 系统 中 每 个 进程 的 线程 数量 


立即 返回 ,如 果 锁 状态 本 来 已 经 是 unlocked, 调 用 该 方法 将 会 抛 出 异常 。 


可 重 入 锁 RLock 对 象 也 是 一 种 常用 的 线程 同步 原 语 ,可 被 同一 个 线程 acquire() 多 
次 。 当 处 于 locked 状态 时 , 某 线程 拥有 该 锁 ; 当 处 于 unlocked 状态 时 ,该 锁 不 属于 任何 线 
程 。RLock 对 象 的 acquire )Vrelease() 调 用 对 可 以 符 套 , 仅 当 最 后 一 个 或 者 最 外 层 的 


release() 执 行 结束 后 , 锁 才 会 被 设置 为 unlocked 状态 。 
fij 10-4 使 用 Lock/RLock 对 象 实现 线程 同步 。 


import threading 
import time 
# 自 定义 线程 类 


class mythread (threading. Thread) : 
def init (self): 


threading.Thread. init _ (self) 


# 重 写 rm() 方 法 
def run (self): 
glcbal x 


# 获 取 锁 ,如 果 成 功 则 进入 临界 区 


1lock.acquire() 
x-xt3 


print (x) 
# 退 出 临界 区 ,释放 锁 
lock.release () 


lock- threading.RLock () 
# 也 可 以 使 用 Iock 类 实现 加 锁 和 线程 同步 
#10ck= threading.Iock() 


# 存 放 多 个 线程 的 列表 

u-r 

for i in range(10): 
# 创 建 线程 并 添加 到 列表 
t-mythread() 
tl.append(t) 


# 多 个 线程 互 斥 访问 的 变量 
x-0 
# 启 动 列 表 中 的 所 有 线程 
foriintl: 

i.start() 
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保存 并 运行 上 面 的 程序 ,依次 输出 3、6、9、12、15、18、21、24、27、30 这 几 个 数字 。 把 


lock. acquire() 和 lock. release() 这 两 行 注释 或 删除 之 后 再 运行 ,会 发 现 多 个 线程 之 间 没 
有 任何 “上 默契”, 输出 结果 变 得 杂乱 无 章 ,并 且 每 次 运行 都 会 得 到 不 同 的 结果 ,完全 不 可 
再 现 。 


您 注意 : 多 线程 同步 时 如 果 需 要 获得 多 个 锁 才 能 进入 临界 区 ,可 能 会 发 生死 锁 ,在 


inport threading 
inport time 


class mythreadl (threading. Thread) : 

def init (self): 

threading. Thread. init — (self) 
def run (self): 

lockl.acguire() 

lock2.acguire() 

# 实 际 功能 代码 略 ) 

lock2.release|() 

lockl.release() 


多 线程 编程 时 一 定 要 注意 并 认真 检查 和 避免 这 种 情况 。 例如, 下面 的 代码 在 计算 机 非常 
繁忙 的 情况 下 就 有 可 能 发 生死 锁 , 感 兴趣 的 读者 可 以 搜索 一 下 “哲学 家 就 餐 问 题 " 了 解 更 
多 内 容 。 
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class mythread? (threading.Thread) : 
def init (self): 
threading.Thread. init (self) 
def run (self): 
lock2.acguire() 
lockl.acguire () 
# 实 际 功能 代码 略 ) 
lockl.release() 
lock2.release() 


lockl- threading.RLock () 
lock2- threading.RLock () 
tl-mythreadl () 
t2-mythread? () 
tl.start() 

t2.start() 


2. Condition XJ $& 


使 用 Condition 对 象 可 以 在 某 些 事件 触发 后 才 处 理 数据 或 执行 特定 的 功能 代码 ,可 
以 用 于 不 同 线程 之 间 的 通信 或 通知 ,以 实现 更 高 级 别 的 同步 。Condition 对 象 除了 有 具有 
acquire() 和 release() 方 法 之 外 ,还 有 wait() ,notifyO notify_all() 等 方法 。 下 面 通过 经 
典 的 生产 者 /消费 者 问题 来 演示 Condition 对 象 的 用 法 ,程序 中 生产 者 线程 和 消费 者 线程 
共享 一 个 列表 ,生产 者 负责 在 列表 尾部 追加 元 素 , 消 费 者 则 从 列表 首部 获取 并 删除 元 素 。 
如 果 列 表 长 度 到 了 20 表示 已 满 ,生产 者 等 待 ,如 果 列 表 已 空 则 消费 者 等 待 。 

例 10-5 使 用 Condition 对 象 实现 线程 同步 。 

— 

fram randcm import randint 

fram time import sleep 


# 自 定义 生产 者 线程 类 
Class Producer (threading.Thread) : 
def | init (self, threadname): 
threading.Thread. init ^ (self,name- threadname) 
def run(self): 
glcbal x 
while True: 
# 获 取 锁 
con.acqnire() 
# 假 设 共 享 列表 中 最 多 能 容纳 20 个 元 素 
if len(x)-- 20: 
# 如 果 共 享 列表 已 满 ,生产 者 等 竺 


con.wait () 


print('Producer is waiting" ') 
else: 
print ('Producer:', end- ' ') 
# 产 生 新 元 素 , 添 加 至 共享 列表 
x.append (randint (1, 1000)) 
print (x) 
sleæp(1) 
# 唤 醒 等 待 条 件 的 线程 
con.notify() 
# 释 放 锁 


con.release() 


# 自 定义 消费 者 线程 类 
class Consumer (threading.Thread) : 
def init — (self, threadname): 
threading.Thread. init — (self, name = threadname) 
def run (self): 
global x 
while True: 
# 获 取 锁 
con.acquire () 
if not x: 
# 等 待 
con.wait () 
print('Consumr is waiting ') 
else: 
print (x.pop (0) ) 
print(x) 
sleep) 
con.notify() 
con.release () 


# 创 建 Condition 对 象 以 及 生产 者 线程 和 消费 者 线程 
con- threading.Conditicn () 

x 

p= Producer (' Producer!) 


c= Consumer ('Consumer') 


该 程序 的 运行 结果 如 图 10-6 所 示 。 
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» 
==—=————=—======= RESTARI: C:WPython 3. 5\deno. py ======== 
>>> Producer: [842] 

Producer: [842, 755 

Producer: [842, 755, 713] 

Producer: [842, 755, 713, 73] 

Producer: [842, 755, 713, T3, 186] 


842 
[755, 713, 73, 166] 

Producer: [755, 713, T3, 166, 902] 
Producer: [T55, 713, 73, 166, 902, 921] 


[713, T3, 166, 902, 921] 
Producer: [T13, 73, 166, 902, 921, 448] 


713 
[73, 166, 902, 921, 448] 

Producer: [T3, 166, 902, 921, 448, 53] 
Producer: [T3, 166, 902, 921, 448, 53, 865] 


73 
[166, 902, 921, 448, 53, 865] 


图 10-6 使 用 Condition 实现 线程 同步 


3. Queue 对 象 


queue 模块 (在 Python 2 中 为 Queue 模块 ) 的 Queue 对 象 实现 了 多 生产 者 /多 消费 者 
队列 ,尤其 适合 需要 在 多 个 线程 之 间 进 行 信 息 交 换 的 场合 ,实现 了 多 线程 编程 所 需要 的 所 
有 锁 语 义 。 

例 10-6 使 用 queue 对 象 实现 线程 同步 。 

pm 

import time 

import queue 


# 自 定义 生产 者 线程 类 
class Producer (threading. Thread) : 
def init (self, threadname): 
threading. Thread. init — (self, name= threadname) 
def run(self): 
glcbal mygueue 
# 在 队列 尾部 追加 元 素 
mygueue.put (self.getName () ) 
print (self.getName(), ' put ', self.getName(), ' to queue.) 


class Consumer (threading. Thread) : 
def init — (self, threadname): 
threading.Thread. init — (self, name= threadname) 
def run(self): 
global mygueue. 
# 在 队列 首部 获取 元 素 
print (self.getName(), ' get. ', myqueue.get (), ' fram queue.) 


myqueue- queue Queue () 


# 创 建生 产 者 线程 和 消费 者 线程 
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plist- [] 
clist- [] 
for i in range(10): 
p= Producer ("Producer str (i)) 


plist.append (p) 

c= Consumer ('Consumer''* str (i)) 

clist.agpend(c) 
# 依 次 启动 生产 者 线程 和 消费 者 线程 
for p, c in zip(plist, clist): 

p.start () 

p.join() 

c.start() 

c.join() 
上 面 的 程序 运行 结果 如 下 : 
Producer0 put Producer0 to queue. 
ConsumerÜ get  Producer0 from queue. 
Producerl put Producer to queue. 
Consumerl get  Producerl from queue. 
Producer2 put Producer2 to queue. 
Consumer2 get  Producer2 from queue. 
Producer3 put Producer3 to queue 
Consumer3 get  Producer3 from queue. 
Producerd put Producer4 to queue. 
Consumerd get  Producer4 from queue. 
Producer5 put Producer5 to queue 
Consumer5 get  Producer5 from queue. 
Producer6 put Producer6 to queue. 
Consumer6 get  Producer6 from queue. 
Producer7 put Producer7 to queue. 
Consumer7 get  Producer7 from queue. 
Producer8 put Producer8 to queue. 
Consumer8 get  Producer8 from queue. 
Producer9 put Producer9 to queue 
Consumer9 get  Producer9 from queue. 
4. Event 对 象 


Event 对 象 是 一 种 简单 的 线程 通信 技术 ,一 个 线程 设置 Event 对 象 , 另 一 个 线程 等 待 
Event 对 象 。Event 对 象 的 set() 方 法 可 以 设置 Event 对 象 内 部 的 信号 标志 为 真 ;clear() 
方法 可 以 清除 Event 对 象 内 部 的 信号 标志 ,将 其 设置 为 假 ;isSet() 方 法 用 来 判断 其 内 部 信 
号 标志 的 状态 ;wait() 方 法 在 其 内 部 信号 状态 为 真 时 会 立刻 执行 并 返回 , 若 Event 对 象 的 
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内 部 信号 标志 为 假 ,wait() 方 法 就 一 直 等 待 至 超时 或 者 内 部 信号 状态 为 真 。 
例 10-7 使 用 Event 对 象 实现 线程 同步 。 


import threading 


# 自 定义 线程 类 
class mythread (threading. Thread) : 
def init _ (self, threadname): 
threading. Thread. init — (self, name= threadname) 


def run (self): 
global myevent 
# 根 据 Event 对 象 是 否 已 设置 做 出 不 同 的 响应 
if myevent.isSet(): 
# 清 除 标志 
myevent.clear () 
# 等 待 
myevent .wait () 
print (self.getName ()* ' set') 
else: 
vint oe E gatiim 1 mot se) k python 3.5»python demo.py 
# 设 置 标志 3 
myevent.set () 


myevent= threading.Event () 
# 设 置 标志 


myevent.set () : 3.5»python demo.py 


for i in range(10): 
t-mythread (str (1)) 
t.start() 
将 上 面 的 代码 保存 为 demo. py 文件 并 多 次 
运行 ,会 发 现 每 次 运行 结果 略 有 不 同 , 图 10-7 是 
其 中 两 次 的 运行 结果 。 


10-7 使 用 Event 对 象 实现 线程 同步 


10.2 多 进程 编程 


进程 是 正在 执行 中 的 应 用 程序 。 一 个 进程 是 一 个 执行 中 的 文件 使 用 资源 的 总 和 , 包 
括 虚拟 地 址 空间 、 代 码 、 数 据 、 对 象 句柄 \ 环 境 变 量 和 执行 单元 等 。 一 个 应 用 程序 同时 打开 
并 执行 多 次 ,就 会 创建 多 个 进程 。 

Python 标准 库 multiprocessing 用 来 实现 进程 的 创建 与 管理 以 及 进程 间 的 同步 与 数 
据 交 换 ,用 法 与 threading 类 似 ,是 支持 并 行 处 理 的 重要 模块 。 标 准 库 multiprocessing 同 
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时 支持 本 地 并 发 与 远程 并 发 ,有 效 避 免 了 全 局 解释 器 锁 (Global Interpreter Lock. GIL) [i] 
题 , 可 以 更 有 效 地 利用 CPU 资源 ,尤其 适合 多 核 或 多 CPU 环境 。 


1021 进程 创建 与 管理 


与 使 用 threading 创建 和 启动 线程 类 似 ,可 以 通过 创建 Process 对 象 来 创建 一 个 进 
程 ,然后 通过 调用 进程 对 象 的 start() 方 法 来 启动 ,通过 调用 join() 方 法 等 待 一 个 进程 执行 
结束 。 

例 10-8 进程 创建 与 启动 。 


fram multiprocessing import Process 


import os 

def f (nae): 
print('module name:', — name ) 
print('parent prooess:', os.getppid()) # 查 看 父 进程 ID 
print ('prooess id:', os.getpid()) # 查 看 当前 进程 ID 


print('hello', name) 


if name  --' main ': 
p= Process (target- f, args- ('bcb',)) # 创 建 进程 
p.start() # 启 动 进程 
p-join() # 等 待 进程 运行 结束 


的 小 提示 : 本 节 的 很 多 程序 需要 在 命令 提示 符 环境 中 运行 。 

除了 支持 与 threading 管理 线程 相似 的 接口 之 外 ,multiprocessing 还 提供 了 Pool 对 
象 支持 数据 的 并 行 操作 。 例 如 ,下 面 的 代码 可 以 并 发 计算 二 维 数组 每 行 的 平均 值 。 

frm multiprocessing import Pool 

fram statistics import mean 


if nme — aS *' min ': 
x= [list (range (10)), list (range (20,30)), 
list (rang (50,60)), list (range (80,90) ) ] 
with Pool (5)as p: # 创 建 包含 5 个 进程 的 进程 池 


print (p.map (f, x)) # 并 发 运行 


1022 进程 间 数 据 交 换 


例 10-9 使 用 Queue 对 象 在 进程 间 交 换 数据 ,一 个 进程 把 数据 放 入 Queue 对 象 , 另 
一 个 进程 从 Queue 对 象 中 获取 数据 。 
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import miltiprocessing as mp 
def fo (q): 
q.put ('hello world! ') # 把 数据 放 入 队列 
if nme  --' main - 
mp.set start method('spawn') #Windows 系统 创建 子 进程 的 默认 方式 
Wp.Qeuel) 
penp.Process (target- foo, args- (q,)) # 创 建 进程 ,把 Queue 对 象 作为 参数 传递 
p.start () 
p-join() 
print(q.get ()) # 从 队列 中 获取 数据 


也 可 以 使 用 上 下 文 对 象 context 的 Queue 对 象 实现 不 同 进程 间 的 数据 交换 。 
inport multiprocessing as mp 


def foo(q) : 
q.put ('hello world') 


p= ctx.Process (target- foo, args- (q,)) 
p.start () 
p-join() 
print (q.get ()) 
fi 10-10 使 用 管道 实现 进程 间 数 据 交 换 。 管 道 有 两 个 端 ,一 个 接收 端 和 一 个 发 送 
端 ,相当 于 在 两 个 进程 之 间 建 立 了 一 个 用 于 传输 数据 的 通道 。 


frammultiprocessing import Process, Pipe 


def f(conn): 
conn.send ('hello world') # 向 管道 中 发 送 数据 
conn.close() # 关 闭 管道 
if nme  --' mein ': 
parent conn, child conn- Pipe() # 创 建 管道 对 象 
p- Process (target- £, args- (child aom,)) PERRO- ERARE a TAE 
p.start () 
p-join() 
print (parent conn.recv()) # 通 过 管道 的 另 一 方 获取 数据 


parent conn.close() 


例 10-11. 使 用 共享 内 存 实现 进程 间 数 据 传递 ,比较 适合 大 量 数据 的 场合 。 
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fran multiprocessing import Process, Value, Array 


def f(n, a): 
n.value=3.1415927 
for i in range(len(a)): 
a[i]-a[i]* a[i] 
if nme _=='_ main — 
num- Value ('d', 0.0) # 实 型 
arr- Array ('i', range (10)) # 整 型 数组 
p= Process (target- f, args- (num, arr)) # 创 建 进程 对 象 
p.start() 
p-join() 
print (num.value) 
print (arr [:]) 
例 10-12 使 用 Manager 对 象 实现 进程 间 数 据 交 换 。 
Manager 对 象 控制 一 个 拥有 list, dict, Lock, RLock, Semaphore, BoundedSemaphore., 
Condition, Event, Barrier, Queue, Value, Array, Namespace 等 对 象 的 服务 端 进程 ,并 且 人 允许 其 
他 进程 访问 这 些 对 象 。 


frammultiprocessing import Process, Manager 


def f(d, 1, t): 
(nane J= 'Dong Fuguo' 
d['age! ]- 38 


d['sex']- 'Male' 
d['affiliation']- 'SDIBT" 
l.reverse() 

t.value- 3 


if nme — : 
with Manager () as manager: 
d- manager .dict () 
l= manager. list (range (10) ) 
t-manager.Value('i', 0) 
p- Process (target- f, args- (d, 1, t)) 
p.start () 


p-join() 

for item in d.items(): 
print (item) 

print (1) 

print (t.value) 
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1023 进程 同步 技术 


在 需要 协同 工作 完成 大 型 任务 时 ,多 个 进程 间 的 同步 非常 重要 。 进 程 同 步 方法 与 线 
程 同步 方法 类 似 ,稍微 改写 一 些 代 码 即 可 ,下 面 以 Lock 对 象 和 Event 对 象 为 例 简单 演示 
其 用 法 。 

例 10-13 使 用 Lock 对 象 实现 进程 同步 。 


fram multiprocessing import Process, Lock 


def fü, i): 
l.acguire() # 获 取 锁 
try: 
print ('hello world', i) 
finally: 
l.release() # 释 放 锁 
if name  --' main ': 
lock-Lock() # 创 建 锁 对 象 


for num in range (10) : 
Process (target- f, args- (lock, num)).start() 


例 10-14 ”使 用 Event 对 象 实现 进程 同步 。 
frm multiprocessing import Process, Event 


def f(e, i): 
ife.is set(): 
e.wait() 
print ('hello world', i) 
e.clear() 


for num in range (10) : 
Process (target- f, args- (e,num)) .start () 


您 注意 : 与 多 线程 编程 类 似 , 在 编写 多 进程 程序 时 ,一 定 要 控制 好 进程 之 间 的 同步 ， 
避免 “ 死 锁 ”。 


11.1 大 数据 简介 


历史 上 有 个 著名 的 故事 叫 * 草 船 借 箭 ”, 故 事 的 主人 公 诸 葛 亮 对 天 象 的 观察 实际 上 就 
是 对 风云 .温度 ,湿度 .光照 和 所 处 节气 等 大 量 多 元 化 的 非 结构 数据 进行 综合 分 析 , 最 终 
通过 复杂 的 计算 得 出 了 正确 的 结论 , 正 是 他 精准 的 预测 才能 有 “万 事 俱 备 ,只 欠 东 风 ” 的 从 
容 ,最 终 为 决策 提供 了 有 力 支持 ,这 可 以 看 作 是 大 数据 的 一 个 经 典 应 用 。 

大 数据 的 概念 自从 提出 来 以 后 ,迅速 在 各 行 各 业 得 到 广泛 应 用 。 如 饭店 选 址 、 客 户口 
味 分 析 、 菜 品 销量 预测 、 食 材 供应 商 原材料 质量 分 析 , 企 业 运 作 的 内 在 规律 挖掘 ,调度 管 
理 ,物流 优化 ,社交 网 络 , 智 能 交通 ,城市 规划 ,客户 关系 管理 ,智能 推荐 系统 ,智能 定制 广 
告 ,信息 安全 ,个 人 生活 ,等 等 。 大 数据 不 仅仅 是 对 历史 数据 进行 分 析 , 更 重要 的 是 通过 分 析 
历史 数据 对 未 来 进行 精准 预测 ,未雨绸缪 ,挖掘 潜在 的 商机 ,预测 并 尽量 避免 可 能 的 危机 。 

目前 在 学 术 界 公 认 的 大 数据 有 四 大 特征 。 

COD 数据 量 巨 大 。 在 过 去 的 20 年 里 全 球 数据 量 增 长 了 100 多 倍 ,并 且 以 越 来 越 快 的 
速度 持续 增长 ,数据 量 的 单位 从 TB 级 别 跃升 到 PB 甚至 EB.ZB 级 别 。 根 据 IDC 的 “ 数 
字 宇 宙 ” 的 报告 ,预计 到 2020 年 ,全 球 数据 使 用 量 将 达到 35. 2ZB。 

(2) 数据 类 型 繁多 。 非 结构 化 数据 越 来 越 多 ,如 邮件 、 网 络 日 志 、 音 频 、 微 信 、 微 博 、 视 
频 、 图 片 、 地 理 位 置信 息 等 ,这 对 数据 处 理 能 力 和 算法 提出 了 非常 高 的 要 求 。 

(3) 价值 密度 低 。 例 如 ,没有 任何 意外 事件 发 生 时 ,连续 不 间断 的 监控 视频 是 没有 任 
何 价值 的 ,而 发 生意 外 事件 时 连续 若干 小 时 的 监控 视频 中 真正 有 价值 的 数据 很 可 能 只 有 
几 秒 钟 。 

(4) 要 求 处 理 速度 快 。 大 数据 时 代 的 数据 产生 速度 非常 快 ,例如 ,1 分 钟 的 时 间 里 新 
浪 微 博大 概 增 加 2 万 条 信息 ,Twitter 产生 超过 10 万 条 推 文 ,Facebook 会 产生 600 万 次 
访问 记录 。 可 以 说 ,在 如 此 海量 并 且 飞 速 增加 的 数据 面前 ,处 理 数 据 的 效率 就 是 企业 的 生 
命 ,在 某 些 企业 秒 级 的 延迟 已 经 是 能 够 容忍 的 极限 。 

一 般 而 言 ,进行 大 数据 处 理 时 ,首先 要 分 析 原 始 数据 的 质量 .尤其 是 缺失 值 . 异 常 值 、 
重复 数据 ,特殊 符号 等 ,通过 精 选 数据 样本 ,提高 原始 数据 的 相关 性 、 可 靠 性 有效 性 ,不 仅 
能 够 节省 系统 资源 ,更 重要 的 是 提高 探寻 数据 内 在 规律 的 准确 性 。 然 后 再 分 析 采 样 的 数 
据 的 分 布 特征 与 类 型 .周期 性 、 贡 献 度 、 相 关 性 等 各 项 指标 。 如 何 通 过 强大 的 计算 能 力 和 
高 效 的 算法 更 迅速 地 完成 数据 的 价值 “提纯 ”是 目前 大 数据 背景 下 或 待 解决 的 难题 和 重 
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要 的 研究 热点 之 一 。 另 外 ,数据 的 来 源 直接 导致 分 析 结果 的 准确 性 和 真实 性 ,如 果 数 据 来 
源 是 完整 的 并 且 是 真实 的 ,最 终 的 分 析 结 果 会 更 加 准确 ,并 且 可 以 大 幅度 提高 处 理 速度 。 


11.2 MapReduce 框架 


MapReduce 编程 思路 非常 简单 ,首先 对 大 数据 进行 分 割 , 切 分 为 一 定 大 小 的 数据 , 然 
后 把 分 割 的 数据 交 给 多 个 Mapper 函数 进行 处 理 ,Mapper 函数 处 理 后 将 产生 一 组 规模 较 
小 的 数据 ,多 个 规模 较 小 的 数据 再 提交 给 Reducer 函数 进行 处 理 , 得 到 一 个 更 小 规模 的 数 
据 或 最 终结 果 。 对 于 不 同 的 具体 应 用 ,需要 根据 特定 的 要 求 来 编写 不 同 的 Mapper 和 
Reducer 代码 ,并且 可 能 会 需要 多 次 迭代 来 最 终 完成 任务 ,如 图 11-1 所 示 。 


切 分 


Map 


Reduce 


小 文件 ! [一 一 一 | 


结果 1 


小 文件 [一 一 一 | 


结果 2 


x 


小 文件 3 


结果 3 


小 文件 | -| 


结果 4 


小 文件 5 


结果 5 


图 11-1 MapReduce 流程 


了 解 了 基本 原理 以 后 , 接 下 来 我 们 通过 一 个 例子 来 演示 一 下 MapReduce 思路 的 应 
M. Windows 系统 的 升级 日 志文 件 一 般 较 大 , 现 假设 要 求 统计 一 下 日 志文 件 中 与 不 同日 
期 有 关 的 记录 条 数 。 首 先 将 大 文件 切 分 成 多 个 小 的 文件 ,然后 对 每 个 小 文件 进行 map 处 
理 , 然 后 对 得 到 的 处 理 结果 再 进行 reduce 处 理 , 最 终 得 到 所 需要 的 数据 和 结论 。 


1. 大 文件 切 分 : FileSplit. py 


import os 
import os.path 
import time 


def FileSplit(sourocFile, targetFolder): 
if not os.path.isfile (souroeFile) : 


print(sourceFile, ' does not exist.') 


retum 
if not os.path.isdir (targetFolder) : 
os.mkdir (targetFolder) 
tenpbata- [] 
nunber- 1000 


# 源 文件 必须 存在 


# 目 标 文件 夹 不 存在 则 创建 


# 用 来 存放 临时 数据 
# 切 分 后 的 每 个 小 文件 包含 1000 行 
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fileNum-1 # 切 分 后 的 文件 编号 
with open (scurceFile, 'r')as srcFile: 
dataLine- srcFile.readline () .strip() 


while dataLine: 
for i in range (number): # 读 取 1000 行 文本 
temppata.append(datarine) 
dataLine= srcFile.readline() 
if not dataline: 
break 
desFile- os.path.join(targetFolder, scurceFile[0:- 4]+ str (£ileNum) 
*c.txt!) 
with open(desFile, 'at ')as f: # 创 建 一 个 小 文件 
f.writelines (tempData) 
tenpData- [] 
fileNum- fileNumt 1 # 小 文件 编号 加 1 
if nme  --' main ': 
SourceFile- 'test.txt' # 指 定 源 文件 
targetFolder- 'test' # 指 定 存放 切 分 后 小 文件 的 文件 夹 


FileSplit (sourceFile, targetFolder) 
2. Mapper 代码 : Map. py 


import os 
inport re 
import threading 
import time 


def Map (scurceFile) : # 这 段 代 码 仅 适 用 于 配套 文件 
if not os.path.exists (scuroeFile) : # 或 者 类 似 的 windows 升级 日 志 
print(sourceFile, ' does not exist.') 
return 
pattern- re.oarpi le (r' [0- 9] (1,2) [0- 9] (1,2)/ [0- 9] (4) ") 
result- () 
with open(scurceFile, 'r')as srcFile: 
for dataLine in srcFile: 
r-pattern.findall (dataLine) # 查 找 符 合 日 期 格式 的 字符 串 
ifr: 
result[r[0]]- result.get (r[0], 0)+1 
desFile- sourceFile[0:- 4]+ ' map.txt' 
with cpen(desFile, 'at ')as fp: # 中 间 临 时 结果 
for k, v in result.items(): 
fp.write(k* ':'+ str(v)* '\n') 


354 à Python 可 以 这 样 学 


s 


files= os.listdir (desFolder) 

def Main(i): # 使 用 多 线程 
Map(desFoldert 'NV'* £iles[i]) 

fileNunber- len (files) 

for i in range (fileNunber) : 
t= threading.Thread(target- Main, args = (i,)) 
t.start() 


3. Reducer 代码 : Reduce. py 


fram os.path import isdir 
fram os import listdir 


def Reduce (souroeFolder, targetFile): 
if not isdir (scuroeFolder): 
print (sourceFolder, ' does not exist.') 
retum 
result= {} 
#Deal only with the mapped files 
allFiles- [scurceFoldert '\\'+ f for f in listdir (scuroeFolder) 
if f.endswith(' map.txt')] 
for f in allFiles: 
with open(f, 'r')as fp: 
for line in fp: 
line-line.strip() 
if not line: 
continue 
key, value- line.split(':') # 结 合 ap.py 代 码 理解 这 个 地 方 
result [key]= result.get (key, 0)+ int (value) 
with cpen(targetFile, 'w')as fp: # 创 建 结果 文件 
for k,v in result.items(): 
fp.write(k* ':'* str(v)t 'An') 


if nme  --' main ': 


Reduce (test', 'test\\result.tt') 
保存 并 运行 上 述 程序 ,首先 运行 FileSplit. py, 将 文件 切 分 ,生成 若干 小 文件 , 如 
图 11-2 所 示 。 
然后 运行 Map. py 程序 ,得 到 中 间 结 果 , 如 图 11-3 所 示 。 
最 后 运行 Reduce. py 程序 ,得 到 最 终结 果 , 如 图 11-4 所 示 。 
也 可 以 使 用 下 面 的 思路 来 解决 上 面 这 个 问题 ,不 需要 对 大 文件 进行 切 分 ,改写 Map 
. py 程序 代码 如 下 (文件 名 为 Hadoop_Map. py): 
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dà » 计算 机 » WIN7 (C) » Python 3.5 » test 


图 11-4 Reduce 结果 
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def Map (scurceFile) : 
if not os.path.exists (scurceFile) : 
print(sourceFile, ' does not exist.') 
retum 
patterm- re.campile (r' [0- 9] {1,2}/ [0- 9] (1,2)/ [0- 9] {4}") 
result- {} 
with open(scurceFile, 'r')as srcFile: 
for dataline in srcFile: 
r-pattern.findall (dataLine) 
ifr: 
print(r[0], ',', 1) # 将 中 间 结果 输出 到 标准 控制 台 
Map ('test.txt!) 
然后 将 Reduce. py 程序 代码 改写 如 下 (文件 名 为 Hadoop. Reduce. py) : 
import os 
import sys 
def Reduce (targetFile): 
result- () 
for line in sys.stdin: # 从 标准 控制 台中 获取 中 间 结 果 数据 
riqi, shuliang= line.strip() .split(',") 
result[rigi]- result.get (riqi, 0)+1 
with open(targetFile, 'w')as fp: 
for k,v in result.items(): 
fp.write (kt ':'+ str(v)* '\n') 
Reduce ('result.txt') 
最 后 在 命令 提示 符 环境 中 执行 下 面 的 命令 ,其 中 竖 线 (| ) 表 示 管 道 ,前 一 个 程序 的 输 
出 直接 作为 后 面 程序 的 输入 。 
python Hadoop Map.py test.txt | python Hadoop Reduce.py 
假设 测试 样本 文件 test. txt 在 当前 文件 夹 中 ,命令 执行 结束 后 ,在 当前 文件 夹 生成 结 
果 文 件 result. txt, 内 容 与 图 11-4 完全 一 致 。 
QARAR: 在 Win 7 系统 中 , 单 南 “ 开 始 ”>“ 计 算 机 ”>“ 管 理 "命令 ,然后 展开 “ 事 
件 查看 器 ”, 选 择 感 兴趣 的 事件 类 别 并 右 击 ,选择 "将 所 有 事件 另存 为", 就 可 以 把 系统 日 志 
保存 为 记事 本 文档 。 上 面 例 子 中 用 到 的 系统 日 志 就 是 这 么 导出 的 。 


11.3 Spark 应 用 开发 


Hadoop Æ Apache 软件 基金 会 旗下 的 一 个 开源 分 布 式 计算 平台 ,以 分 布 式 文件 系统 
HDFS 和 MapReduce 为 核心 ,为 用 户 提 供 了 系统 底层 细节 透明 的 分 布 式 基础 框架 ,允许 
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用 户 部 署 在 低 端 硬件 上 ,并且 不 需要 了 解 底层 细节 就 可 以 开发 并 行 应 用 程序 。Hadoop 
的 缺点 是 其 Shuffle 过 程 对 本 地 硬盘 L/O 操作 过 多 ,并 且 不 适合 SQL 交互 式 查询 、 实 时 流 
处 理 以 及 机 器 学 习 等 应 用 。 

Spark 是 一 个 基于 内 存 的 开源 计算 框架 ,其 活跃 度 在 Apache 基金 会 所 有 开源 项 目 中 
排 第 三 位 ,其 特点 在 于 基于 内 存 计 算 , 适 合 迭 代 计 算 , 兼 容 多 种 应 用 场景 ,同时 还 兼容 
Hadoop 生态 系统 中 的 组 件 , 并 且 具 有 非常 强 的 容错 性 。Spark 的 设计 目的 是 全 栈 式 解决 
批 处 理 ,结构 化 数据 查询 、 流 计算 、 图 计算 和 机 器 学 习 等 业务 和 应 用 。 

Spark 集成 了 Spark SQL (分 布 式 SQL 查询 引擎 ,提供 了 一 个 DataFrame 编程 抽 
象 ) .Spark Streaming( 把 流 式 计 算 分 解 成 一 系列 短小 的 批 处 理 计 算 , 并 且 提 供 高 可 靠 和 
吞吐 量 服务 )、MLlib (提供 机 器 学 习 服 务 )、GraphX (提供 图 计算 服务 )、SparkR(R on 
Spark) 等 子 框架 ,为 不 同 应 用 领域 的 从 业者 提供 了 全 新 的 大 数据 处 理 方式 , 越 来 越 便捷 、 
轻松 。 

为 了 适应 迭代 计算 ,Spark 把 经 常 被 重用 的 数据 缓存 到 内 存 中 以 提高 数据 读 取 和 操 
作 速 度 ,Spark 比 Hadoop ft yt Fi fi. x d Java, Scala, Python, R 等 多 种 语言 , 除 map 和 
reduce 之 外 ,还 支持 filter ,foreach、reduceByKey、aggregate 以 及 SQL 查询 \ 流 式 查 询 等 。 

旧时 王 谢 堂前 燕 , 飞 人 寻常 百姓 家 。 随 着 普通 家 用 计算 机 (手机 也 早已 进入 多 核 时 
代 , 但 如 何在 手机 上 搭建 Spark 环境 不 在 本 书 讨论 范围 之 内 ) 进 入 多 处 理 器 和 多 核 时 代 ， 
完全 可 以 在 自己 家 的 计算 机 上 搭建 Spark 环境 。 当 然 , 如 果 数 据 量 大 到 一 定 程 度 , 还 是 要 
在 集群 或 云 平台 上 部 署 的 Spark 环境 中 进行 处 理 和 计算 。 进 行 Spark 应 用 开发 时 一 般 是 
先 在 本 地 进行 开发 和 测试 ,通过 测试 后 再 提交 到 集群 执行 。 下 面 我 们 以 Win 7 平台 为 例 
介绍 Spark 环境 的 搭建 和 简单 使 用 。 首 先 安装 JDK 并 配置 环境 变量 path, 下 载 安装 
Scala 语言 包 并 配置 系统 环境 变量 path ,下载 安装 Spark 并 配置 系统 环境 变量 HADOOP 
_HOME 和 SPARK HOME 的 值 为 Spark 安装 目录 ,使 用 pip 工具 安装 扩展 库 py4j ,到 
http://public-repo-1. hortonworks. com/hdp-win-alpha/winutils. exe 网 址 下 载 winutils. 
exe 放 到 Spark 安装 目录 的 bin 文件 夹 中 ,最 后 切换 至 命令 提示 符 环境 并 切换 到 F:\ 
spark-1. 6. 1-bin-hadoop2. 6\bin 文件 夹 ,执行 命令 pyspark. cmd, 进 入 Python 开发 环境 ， 
如 图 11-5 所 示 。 可 以 看 到 ,不 仅 可 以 使 用 pyspark 库 , 还 可 以 使 用 Python 标准 库 和 已 安 
装 的 扩展 库 。 

另外 ,在 Spark 的 bin 文件 夹 中 还 提供 了 spark-submit. cmd 文件 ,这 个 文件 是 用 来 
执行 Python 程序 的 ,使 用 任意 Python 开发 环境 编写 程序 文件 hello. py, 其 中 只 有 一 行 
代码 : 

print ('Hello world') 


然后 在 命令 提示 符 环境 中 提交 该 程序 即 可 执行 ,如 图 11-6 所 示 。 
下 面 的 Python 程序 文件 pi. py 用 来 估算 圆周 率 的 值 ,保存 至 Spark 安装 目录 中 的 
bin 目录 ,可 以 使 用 命令 spark-submit. cmd pi. py 运行 程序 并 输出 圆周 率 的 值 。 


fram pyspark import SparkConf, SparkContext 
fram pyspark.sql import SQLContext 
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67807782 8 WARN NativeCodeLoader: Unable to load native-hadoop library fo 
your platform... using builtin-java classes where applicable 
lcome to 


/NN version 1.6.1 


[eins Python version 3.5.1 (v3.5.1:37a87cee5969, Dec 6 2015 01:54:25) 
parkContext available as sc, HiveContext available as sqlContext. 
p»» print('hello world’) 

[hello world 

p?» import math 

>> print(math.sqrt(9)) 

p.e 

>> import pyspark 

>> from PIL import Image 


图 11-5 pyspark 开发 界面 


:vspark-1.6-1-bin-hadoop2.6\hin>spark-submit -cmd hello.py 


lello world 


JF: Nspark-1 .6 -1-bin-hadoop2.6 bin»? 


图 11-6 执行 Python 程序 


fram randcm import randam 


conf- SparkConf () .setAppNane ("pi") 
Sc- SparkContext (conf- conf) 
SqiCtx- SQLContext (sc) 


def sample (p): 
X, y- random(), randam() 
retum 1 if x* xt y* y<1 else 0 


NUM SAMPLES- 100000 # 数 值 越 大 结果 越 准确 
count= sc.parallelize (range (NUM SAMPIES)) 

count- count .map (sample) reduce (lambda a, b: a+b) 

print(*- '* 30) 

print ("Pi is roughly f" $(4.0 * count / NUM SAMPIES)) 

print('='* 30) 


下 面 的 代码 使 用 Spark 来 统计 100 000 000 以 内 的 素数 数量 ,在 6GB RAM, XU 
CPU 的 64 f; Win 7 十 Spark 单机 平台 上 运行 时 间 为 765. 015 428s。 


from pyspark import SparkConf, SparkContext 
fram pyspark.sql import SQLContext 
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fram randm import random 


conf= SparkConf () .setAppName ("isPrime") 
Sc- SparkContext (conf- conf) 
sqlCbs SQLContext (sc) 
def isPrime(n): 
ifnc2: 
return False 
if n--2: 
retum True 
if not nsl: 
return False 
for iin range(3, int(n**0.5)* 2, 2): 
if n$i--0: 
return False 
return True 
rdd- sc.parallelize (range (100000000) ) 
result- rdd.filter (isPrime) .count () 
print('*- 'x* 30) 
print (result) 


下 面 的 代码 在 相同 的 平台 上 使 用 传统 的 方式 来 求解 同一 个 问题 ,运行 时 间 为 1666. 
616 000 18 秒 , 由 此 可 见 , 即 使 是 在 单机 多 核 环境 下 ,spark 也 会 获得 速度 上 的 很 大 提高 ， 
提高 的 比例 和 处 理 器 的 数量 有 一 定 的 关系 。 


import time 


def isPrime(n): 
if nc2: 
return False 
ifn--2: 
return True 
if not n&l: 
return False 
for i in range(3, int(n**0.5)4 2, 2): 
if n$i--0: 
return False 
return True 


num- 0 
start- time.time() 

for n in range (100000000) : 
if isPrime(n): 
mm+=1 


print (num) 
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print (time.time () - start) 


下 面 的 代码 演示 了 pyspark 的 很 少 一 部 分 功能 和 用 法 ,更 加 详细 的 函数 介绍 请 参考 
网 址 http://spark. apache. org/docs/latest/api/python/pyspark. html. 


> > > fran pyspark inport SparkFiles 
»»»path- 'test.txt' 
>>> with open(path, 'w')as fp: # 创 建文 件 
fp.write('100") 
>>> sc.addFile (path) # 提 交 文 件 
>>> def func(iterator): 
with open (SparkFiles.get ('test.txt'))as fp: # 打 开 文件 
Val= int (fp.readline()) # 读 取 文 件 内 容 


retum [x * Val for x in iterator] 
»»»sc.parallelize([1, 2, 3, 4, 5]) .mapPartitions (func) .collect () 


# 并 行 处 理 
[100, 200, 300, 400, 500] 
>>> sc.parallelize([2, 3, 4]) .count () #count () 用 来 返回 goo 中 元 素 的 个 数 
3 
>>> ro sc.parallelize([L, 2]) 
>>> sorted (rdd.cartesian (rdd) .collect ()) #collect() 返 回 包含 RDD 中 元 素 的 列表 
i 2,0, 2,0, 1), (2, 2)] # 笛 卡 儿 积 


>>> rdi- sc.parallelize([1, 2, 3, 4, 5]) 
»»»rdi.filter(lanbda x: x$2--0).colleetQ # 只 保留 符合 条 件 的 元 素 
[2, 4] 
>> > sorted(sc.parallelize([1, 1, 2, 3]) .distinct () .collect()) 
# 返 回 唯一 元 素 
[1, 2, 3] 
>>> rdd sc.parallelize (range (10) ) 
>>> rdd.mep (lanbda x: str (x)) .collect () Lr 
>> > rdi- sc.parallelize([1.0, 5.0, 43.0, 10.0]) 
>>> rdimex() # 最 大 值 
43.0 
>>> rdd.max(key- str) 
5.0 


Whois. 读者 运行 上 面 的 代码 会 发 现 ,屏幕 上 会 出 现 非常 详细 的 执行 过 程 ,而 实 
际 上 很 多 时 候 我 们 并 不 需要 那些 信息 ,只 想 关心 代码 的 执行 结果 。 如 果 想 关闭 这 些 详细 
信息 的 显示 ,可 以 把 Spark 安装 文件 夹 的 conf 文件 夹 中 log4j. properties. template 文件 
复制 一 份 保存 到 conf 文件 夹 中 并 改名 为 log4j. properties ,然后 使 用 记事 本 打开 新 文件 ， 
把 里 面 的 INFO 都 改 为 WARN ,关闭 后 重启 pyspark. cmd 就 可 以 了 ,这 个 操作 和 设置 对 
使 用 spark-submit. cmd 提交 并 执行 的 程序 也 同样 有 效 。 
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12.1 图 形 编 程 


计算 机 图 形 学 主要 研究 如 何 使 用 计算 机 来 生成 具有 真实 感 的 图 形 ,涉及 的 内 容 主要 
包括 三 维 建 模 、 图 形 几何 变换 .光照 模型 .纹理 映射 .阴影 模型 等 内 容 , 在 机 械 制 造 .虚拟 现 
实 ,游戏 开发 ,漫游 系统 设计 、 产 品 展示 等 多 个 领域 具有 重要 的 应 用 。 随 着 3D 打印 机 的 诞 
生 , 只 要 有 模型 就 能 够 快速 生成 实物 ,无 疑 这 将 会 大 大 扩展 计算 机 图 形 学 的 应 用 范围 , 例 
如 ,可 以 使 用 计算 机 图 形 学 制作 出 各 种 可 爱 的 模型 ,然后 参照 这 些 模型 使 用 3D 打印 机 批 
量 生产 各 种 食品 、 玩 偶 、. 饰 品 等 。 目 前 大 部 分 计算 机 图 形 学 的 书籍 都 是 基于 OpenGL 的 ， 
Python 也 提供 了 相应 的 扩展 库 PyOpenGL, 这 极 大 方便 了 编写 图 形 学 程序 的 Python fé 
序 员 。OpenGL 的 功能 非常 强大 ,提供 了 图 形 学 编程 所 需要 的 所 有 APT 函数 ,本 书 仅 选 
取 很 小 一 部 分 进行 简单 介绍 ,有 了 这 些 入 门 知识 以 后 ,读者 参考 OpenGL 书籍 和 计算 机 
图 形 学 知识 ,很 容易 写 出 更 多 更 好 的 程序 。 


111 绘制 三 维 图 形 


在 OpenGL 中 绘制 图 形 的 代码 需要 放 在 glBegin(mode) 和 glEnd() 这 一 对 函数 的 调 
用 之 间 , 其 中 ,mode 表示 绘图 类 型 , 取 值 范围 如 表 12-1 所 示 。 


表 12-1 mode 取 值 


取 值 d oH 
GL POINTS 绘制 点 
GL_LINES 绘制 直线 
GL_LINE_STRIP 绘制 连续 直线 ,不 封闭 
GL_LINE_LOOP 绘制 封闭 的 连续 直线 
GL_TRIANGLES 绘制 三 角形 
GL TRIANGLE STRIP 绘制 三 角形 串 
GL_TRIANGLE_FAN 绘制 三 角 扇形 
GL_QUADS 绘制 四 边 形 
GL QUAD STRIP 绘制 四 边 形 串 
GL_POLYGON 绘制 多 边 形 
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下 面 的 代码 可 以 绘制 一 个 彩色 三 角形 和 一 条 彩色 直线 。 在 这 段 代 码 中 ,首先 设置 绘 
制 模式 为 多 边 形 ,然后 依次 绘制 该 多 边 形 的 顶点 ,绘制 每 个 项 点 之 前 设置 顶点 颜色 ,然后 
修改 绘制 模式 为 直线 并 指定 直线 段 的 端点 颜色 和 位 置 。 需 要 注意 的 是 ,使 用 glColor3f() 
函数 设置 颜色 之 后 ,直到 下 一 次 使 用 该 函数 改变 颜色 之 前 ,绘制 的 所 有 顶点 都 使 用 这 个 颜 
色 。 或 者 说 ,OpenGL 采用 的 是 “状态 机 ”工作 方式 ,一 旦 设置 了 某 种 状态 之 后 ,除非 显 式 
修改 该 状态 ,否则 该 状态 将 一 直 保 持 。 

例 12-1 绘制 三 维 直线 、 二 维 三 角形 和 圆 。 

inport sys 

fram math import pi as PI 

fram math import sin, cos 

fram OpenGL.GL import * 

fram OpenGL.GLU import * 

fram OpenGL.GIUT import * 


class MyPyOpenGLITest : 
# 重 写 构造 函数 ,初始 化 open, 环境 ,指定 显示 模式 以 及 用 于 绘图 的 函数 
def init — (self, width= 640, height= 480, 
title= 'MyPyOpenGLTest ! encode ('gbk!) ) : 

glutInit (sys.argv) 

glutInitDisplayMode(GLUT RGBA | GLUT DOUBLE | GUUT_ DEPTH) 

glutInitWindowSize (width, height) 

self.window- glutCreateWindow (title) 

# 指 定 绘制 函数 

glutDisplayFunc (self Draw) 

glutIdleFunc (self.Draw) 

self.InitGL(width, height) 


# 根 据 特 定 的 需要 ,进一步 完成 Opena 的 初始 化 
def InitGL(self, width, height): 
# 初 始 化 窗口 背景 为 白色 
glClearColor (1.0, 1.0, 1.0, 0.0) 
glClearDepth (1.0) 
glDepthFunc(GL LESS) 
# 光 滑 泻 染 
glEnable(GL BLEND) 
glShadeModel(GL SMOOTH) 
glEnable(GL FOINT SMOOTH) 
glEnable(GL LINE SMDOTH) 
glEnable(GL POLYGUN SMOOTH) 
glMatrixMode(GL PROJECTION) 
# 反 走样 ,也 称 为 抗 锯齿 


glHint(GL POINT SMDOTH HINT,GL NICEST) 
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glHint (GL LINE SOOM HINT,GL NICEST) 
glHint (GL FOLYGON SMDOTH HINT,GL FASTEST) 
glLoadIdentity () 

# 透 视 投影 变换 

gluPerspective(45.0, float (width) /float (height), 0.1, 100.0) 
glMatri»xMode (GL MODELVIEW) 


# 定 义 自己 的 绘图 函数 

df Draw(self) : 
glClear(GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
glloadIdentity() 
# 平 移 
glTranslatef (- 3.0, 2.0, - 8.0) 
# 绘 制 二 维 图 形 ,z 坐 标 为 0 
# 指 定 模式 ,绘制 多 边 形 
glBegin(GL FOLYGON) 
# 设 置顶 点 颜色 
glColor3f (1.0, 0.0, 0.0) 
# 绘 制 多 边 形 顶 点 
glVertex3f (0.0, 1.0, 0.0) 
glColor3f (0.0, 1.0, 0.0) 
glVertex3f (1.0, - 1.0, 0.0) 
glColor3f (0.0, 0.0, 1.0) 
glVertex3f (- 1.0, - 1.0, 0.0) 
# 结 束 本 次 绘制 
giEnd() 


glTranslatef (3, - 1, 0.0) 


# 绘 制 三 维 线段 
glBegin(GL LINES) 
glcolor3f(1.0, 0.0, 0.0) 
glVertex3f (1.0, 1.0, 1.0) 
glcolor3f (0.0, 1.0, 0.0) 
glVertex3f (- 1.0, - 1.0, 3.0) 
giEnd() 


glTranslatef (- 0.3, 1, 0) 


# 使 用 折线 段 绘制 
glBegin(GL LINE 100P) 
r= 100 

theta-2* PI/n 

r-0.8 
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for i in range (100) : 
x-r* cos(i* theta) 
y-r* sin(i* theta) 
glVertex3f (x, y, 0) 
glEnd 


glutSwapBuffers () 


# 消 息 主 循环 
def Mainloop (self) : 
glutMainLoop() 


if nae  --' mein 
4 实例 化 窗口 对 象 ， 运行 程序 ,启动 消息 主 循环 
w= MyPyOpenGLTest () 
w.Mainloop() 


程序 运行 结果 如 图 12-1 所 示 。 


图 12-1 使 用 OpenGL 绘制 简单 图 形 


1212 绘制 三 次 贝 塞 尔 曲 线 


塞 尔 曲线 /曲面 和 也 样 条 曲线 /曲面 被 广泛 应 用 于 汽车 .轮船 飞机、 高 铁 以 及 其 他 
Pp ta 由 于 高 次 贝 塞 尔 曲线 /曲面 计算 量 过 大 ,所 以 一 般 常 使 用 三 次 贝 塞 
a 而 很 少 使 用 更 高 次 的 ,对 于 复杂 外 形 则 常 使 用 B 样 条 曲线 /曲面 。 下 面 给 
出 一 段 三 次 贝 塞 尔 曲线 的 绘制 过 程 , 对 于 稍微 复杂 的 情况 可 以 使 用 多 段 三 次 贝 塞 尔 曲线 
进行 拼接 。 

在 12. 1. 1 节 中 绘制 简单 图 形 的 程序 框架 基础 上 .首先 增加 一 个 成 员 方 法 计算 三 次 贝 
塞 尔 曲 线 上 给 定 参 数 对 应 的 点 的 坐标 : 
def getBezier(self, P0, Pl, P2, P3, t): 


a0 = (1- t)&*3 
al-3 * (I-t)**2 * t 
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22-3 * tx*2 * (l-t) 
a3 t**3 


x-a0* PO[0]+al* P1[0]+a2* P2[0]+a3* P3[0] 
y=a0* PO[1]+al* P1[1]+a2* P2[1]+a3* P3[1] 
z=a0* PO[2]+al* PL[2]+a2x P2[2]+a3x P3[2] 


retum (x, y, z) 


然后 修改 绘图 方法 Draw() 中 的 代码 如 下 , 即 可 实现 三 次 贝 塞 尔 曲线 的 绘制 。 


def Draw(self) : 
glClear(GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
glIcedIdentity () 
# 平 移 
glTranslatef (- 3.0, 0.0, - 8.0) 
# 指 定 三 次 贝 塞 尔 曲线 的 4 个 控制 点 坐标 
P0=(-4 -2, -9) 
P1 = (-0.5, 3, 0) 
P2 = (2, - 3, 0) 
P3= (4.5, 2, 0) 
# 指 定 模式 ,绘制 连续 的 折线 段 
glBegin(GL LINE STRIP) 
# 设 置顶 点 颜色 
glColor3f (0.0, 0.0, 0.0) 
# 使 用 100 段 直线 段 的 拼接 来 逼近 三 次 贝 塞 尔 曲线 
for i in range (101) : 
# 参 数 上 必须 是 介 于 [0,1] 区 间 的 实数 
t= i/100.0 
p= self.getBezier (P0, Pl, P2, P3, t) 
glVertex3f (* p) 


# 结 束 本 次 绘制 
giEnd() 
glutSwapBuffers () 
(QARAR: DT UE fob Aon E OUR BUT T AME SI S bo i A de 
最 后 一 个 控制 点 是 曲线 的 终点 ,其 他 控制 点 并 不 在 曲线 上 ,而 是 起 到 控制 曲线 形状 的 作 


用 。 另 外 ,曲线 的 起 点 处 与 前 两 个 控制 点 构成 的 线段 相 切 ,而 曲线 的 终点 处 与 最 后 两 个 控 
制 点 构成 的 线段 相 切 。 


1213 纹理 映射 
在 现实 中 ,人 们 主要 通过 物体 表面 丰富 的 纹理 细节 来 区 分 具有 相同 形状 的 不 同 物体 。 
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在 三 维 建 模 时 也 往往 通过 纹理 映射 来 简化 建 模 的 工作 量 , 可 以 在 保证 图 形 具 有 较 强 真实 
感 的 前 提 下 大 幅度 提高 这 染 效率 。 

简单 地 说 ,纹理 映射 就 是 为 物体 表面 进行 贴图 以 使 其 时 现 出 特定 的 视觉 效果 。 这 和 需 
要 首先 准备 好 纹理 ,然后 构建 物体 空间 坐标 和 纹理 坐标 之 间 的 对 应 关系 来 完成 贴图 。 可 
以 使 用 函数 来 生成 一 些 规则 或 不 规则 的 纹理 ,例如 ,粗布 纹理 、 棋 盘 纹 理 、 随 机 纹理 等 ,也 
可 以 将 拍摄 或 通过 网 络 搜索 下 载 的 图 片 作为 纹理 映射 到 物体 表面 上 。 进 行 纹理 映射 之 
前 ,首先 要 读 取 并 设置 纹理 数据 。 

例 12-2 纹理 映射 与 计算 机 动画 。 

inport sys 

fram OpenGL.GL import * 

fram OpenGL.GIUT import * 

fram OpenGL.GIU import * 

fram PIL import Image 


class MyPyOpenGLTest.: 
def init — (self, width- 640, height= 480, 
title= 'MyPyOpenGLTest! encode (gok')) : 
glutInit (sys.argv) 
glutInitDisplayMode(GLUT RGBA | GLUT DOUBLE | GLUT DEPTH) 
glutInitWindowSize (width, height) 
self .window= glutCreateWindow (title) 
glutDisplayFunc (self Drew) 
glutIdleFunc (self.Draw) 
self.InitGL(width, height) 
# 绕 各 坐标 轴 旋 转 的 角度 
self.x-0.0 
self.y-0.0 
self.z-0.0 


# 绘 制图 形 
def Draw(self): 
glClear (GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
glLoedIdentity () 
HE z 轴 平移 
glTranslate (0.0, 0.0, - 5.0) 
# 分 别 绕 x.y、z 轴 旋转 
glFotatef (self.x, 1.0, 0.0, 0.0) 
glFotatef (self.y, 0.0, 1.0, 0.0) 
glFotatef (self.z, 0.0, 0.0, 1.0) 


# 开 始 绘制 立方 体 的 每 个 面 ,同时 设置 纹理 映射 
# 绘 制 四 边 形 
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glBegin (GL QUADS) 

# 设 置 纹理 坐标 
glTexCoord2f(0.0，0.0) 

# 绘 制 顶点 

glVertex3f (- 1.0, - 1.0, 1.0) 
glTexCoordof (1.0, 0.0) 
glVertex3f (1.0, - 1.0, 1.0) 
glTexCoord?f (1.0, 1.0) 
glVertex3f (1.0, 1.0, 1.0) 
giTexCoordf (0.0, 1.0) 
glVertex3f (- 1.0, 1.0, 1.0) 
# 其 他 几 个 面 的 代码 类 似 , 详 见 配 套 资 源 


# 结 束 绘制 

giEd( 

# 刷 新 屏幕 ,产生 动画 效果 
glutSwapBuffers () 

# 修 改 各 坐标 轴 的 旋转 角度 
self.x +=0.2 

self.y +=0.3 

self.z +=0.1 


# 加 载 纹 理 

def LoadTexture (self) : 
im Image.cpen('sample texture.Hmp') 
width, height= img.size 
img img.tobytes ('raw', 'RGXK', 0, - 1) 
glBindTexture (GL TEXIURE 2D, glGenTextures (1)) 
glPixelStorei (GL UNEACK ALIGNMENT, 1) 
glTexImage2D(GL TEXIURE 2D, 0, 4, width, height, 0, GL RGA, 

GL UNSIGNED BYTE, img) 
glTexParameterf (GL TEXTURE 2D, GL TEXIURE WRAP S, GL CLAMP) 
glTexParameterf (GL TEXTURE 2D, GL TEXIURE WRAP T, GL CLAMP) 
glTexParameterf (GL TEXTURE 2D, GL TEXIURE WRAP S, GL REPEAT) 
glTexParameterf (GL TEXTURE 2D, GL TEXTURE WRAP T, GL REPEAT) 
glTexParameterf (GL TEXIURE 2D, GL TEXIURE MAG FILTER, GL NEAREST) 
glTexParameterf (GL TEXTURE 2D, GL TEXIURE MIN FILTER, GL NEAREST) 
glTexEnvf(GL TEXTURE FNV, GL TEXTURE EW MOE, GL DECAL) 


def InitGL(self, width, height): 
self.IoadTexture () 
glEnable(GL TEXTURE 2D) 
glClearcolor (1.0, 1.0, 1.0, 0.0) 
glClearDepth (1.0) 
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glDepthFunc(GL IFSS) 
glShadeModel (GL SMOOTH) 

P TRE BR , 消 隐 

glEnable(GL CULL FACE) 

glOullFace(GL BACK) 

glEnable(GL POINT SMDOTH) 

glEnable(GL LINE SMOOTH) 

glEnable(GL POLYGON SMDOTH) 

glMatrixMode(GL PROJECTICN) 

glHint (GL POINT SMDOTH HINT,GL NICEST) 

glHint(GL LINE SMDOTH HINT,GL NICEST) 

glHint(GL FOLYGON SMDOTH HINT,GL FASTEST) 

glIoadTdentity() 

gluPerspective (45.0, float (width) /float (height), 0.1, 100.0) 


程序 运行 后 ,一 个 带 有 贴图 的 立方 体 在 不 停 地 旋转 , 某 个 时 刻 的 运行 效果 如 图 12-2 
所 示 。 如 果 读 者 在 运行 时 遇 到 错误 ,很 可 能 是 图 片 尺寸 的 问题 ,程序 中 使 用 的 图 片 文件 大 
小 是 256X256, 大 家 可 以 尝试 着 修改 一 下 自己 的 图 片 尺寸 再 运行 。 


12-2 纹理 映射 


1214 响应 键盘 事件 


在 计算 机 动画 或 者 游戏 中 ,经 常 需 要 和 用 户 或 玩家 交互 ,这 就 需要 接收 并 响应 用 户 的 
鼠标 和 键盘 操作 。 在 12. 1.3 节 的 代码 中 稍 做 修改 就 可 以 实现 用 户 通过 键盘 控制 的 旋转 
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立方 体 ,首先 在 类 中 的 Draw() 方 法 中 把 最 后 三 行 修改 各 坐标 轴 旋 转角 度 的 代码 删除 , 然 
后 在 构造 函数 __init__O 〇 中 增加 一 行 代码 : 


glutKeyboardFunc (self.KeyPress) 


然后 在 类 中 增加 一 个 方法 KeyPress O ,用 来 接收 并 响应 键盘 输入 ,用 户 按 下 键盘 上 
的 几 个 字母 键 时 ,立方 体会 沿 不 同 的 轴 进 行 一 定 角度 的 旋转 。 


def KeyPress (self, key, x, y): 
if key-- 'a': 
Self.x +=0.3 
elif key-- 's': 
Self.x -—0.3 
elif ksy-- 'j': 
self.y +=0.3 
elif key-- 'k': 
self.y --0.3 
elif key-- 'g': 
self.z +=0.3 
elif ksy-- 'h': 
self.z -=0.3 


1215 光照 模型 


光照 是 增强 图 形 真实 感 的 重要 技术 之 一 。 光 线 投射 到 物体 表面 上 会 同时 发 生 反 射 、 
透射 和 吸收 等 几 种 情况 ,其 中 进入 人 眼 的 反射 或 透射 光线 使 得 物体 可 见 。 另 外 ,物体 表面 
的 材质 属性 决定 了 对 光线 每 个 分 量 的 反射 系数 ,不 同 的 材质 属性 导致 物体 表面 呈现 出 不 
同 的 颜色 。 可 以 说 ,光源 和 材质 的 属性 共同 决定 了 物体 表面 的 视觉 效果 。 


例 12-3 法 向 量 与 光照 模型 。 


import sys 

fram OpenGL.GL import * 
fram OpenGL.GLU import * 
fram OpenGL.GLUT import * 


class MyPYOpenGLTest: 

# 重 写 构造 函数 ,初始 化 OpenGL 环境 ,指定 显示 模式 以 及 用 于 绘图 的 函数 

def init (self, width=640, height= 480, title-b'Nomml Light"): 
glutInit (sys.argv) 
glutInitDisplayMcde(GLUT FGBA | GLUT DOUBLE | GLUT DEPTH) 
glutInitWindowSize (width, height) 
self.window- glutCreateiindow (title) 
# 指 定 绘制 函数 
glutDisplayFunc (self.Draw) 
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glutIdleFunc (self .Draw) 
self.InitGL(width, height) 


# 根 据 特定 的 需要 ,进一步 完成 Opena 的 初始 化 

def InitGL(self, width, height): 
# 和 初始 化 窗口 背景 为 白色 
glClearColor (1.0, 1.0, 1.0, 0.0) 
glClearDepth (1.0) 
glDepthFunc(GL IESS) 
# 设 置 灯 光 与 材质 属性 
mat sp= (1.0, 1.0, 1.0, 1.0) 
mat sh- [50.0] 
light position = (-0.5, 1.5, 1, 0) 
yellow 1- (1, 1, 0, 1) 
ambient = (0.1, 0.8, 0.2, 1.0) 
glMaterialfv(GL FRONT, GL SPEDULAR, mat sp) 
glMaterialfv(GL FRONT, GL SHININESS, mat sh) 
gllightfv(GL LIGHIO, GL POSITION, light position) 
gllightfv(GL LIGHTO, GL DIFFUSE, yellow 1) 
gllightfv(GL LIGHIO, GL SPEDULAR, yellow 1) 
gllightModelfv(GL LIGHT MODEL AMBIENT, ambient) 
# 启 用 光照 模型 
glEnable(GL LIGHTING) 
glEnable(GL LIGHTO) 
glEnable(GL TEPTH TEST) 
# 光 滑 泻 染 
glEnable(GL BLEND) 
glShadeModel (GL SMOOTH) 
glEnable(GL POINT SMDOTH) 
glEnable(GL LINE SMOOTH) 
glEnable(GL POLYGON SMDOTH) 
glMatrixMode(GL FFOJECTICN) 
# 反 走样 ,也 称 为 抗 锯齿 
glHint(GL POINT SMOOTH HINT,GL NICEST) 
glHint(GL LINE SMDOTH HINT,GL NICEST) 
glHint(GL POLYOON SMDOTH HINT,GL FASTEST) 
glLoadIdentity () 
# 透 视 投影 变换 
gluPerspective (45.0, float (width) /float (height), 0.1, 100.0) 
glMatrisMde (GL MODELVIEW) 


# 定 义 自己 的 绘图 函数 

def Draw (self): 
glClear(GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
glloadīdentity() 
# 平 移 
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glTranslatef (- 1.5, 2.0, — 8.0) 
# 绘 制 三 维 线段 

glBegin(GL LINES) 

# 设 置顶 点 颜色 

glColor3f (1.0, 0.0, 0.0) 

# 设 置顶 点 法 向 量 
glNomal3f (1.0, 1.0, 1.0) 
glVertex3f (1.0, 1.0, - 1.0) 
glColor3f (0.0, 1.0, 0.0) 
glNormal3f (- 1.0, - 1.0, - 1.0) 
glVertex3f (- 1.0, - 1.0, 3.0) 
glEnd() 


# 球 
glColor3f (0.8, 0.3, 1.0) 
glTranslatef (0, - 1.5, 0) 


# 第 一 个 参数 是 球 的 半径 ,后 面 两 个 参数 是 分 自 数 


glutSolidSphere (1.0,40, 40) 


glutSwapBuffers () 


# 消 息 主 循环 


name ==' main ': 


“4 实例 化 窗口 对 象 ,运行 程序 ,启动 消息 主 循环 
w- MyPyOpenGLTest () 
w.MainLoop() 


运行 结果 如 图 12-3 所 示 o 


图 12-3 光照 模型 


- 
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12.2 图 像 处 理 


Python Imaging Library(PIL) 是 Python 的 图 像 处 理 扩展 库 ,提供 了 非常 强大 的 图 像 
处 理 功能 ,支持 多 种 图 像 格式 。PIL 模块 需要 单独 进行 安装 后 才能 使 用 ,在 PIL 中 主要 提 
ft 了 Image, ImageChops、 ImageColor、 ImageDraw、 ImagePath、 ImageFile、 
ImageEnhance, PSDraw 以 及 其 他 一 些 模块 来 支持 图 像 的 处 理 , 而 ImageGrab 模块 还 支 
持 对 指定 区 域 进行 截图 。PIL 对 Python 3. x 支持 不 是 特别 好 ,可 以 使 用 扩展 库 pillow $E 
代 , 本 书 重点 介绍 pillow 的 用 法 。 


1221 pillow 模 块 基本 用 法 


Image 是 pillow 库 中 一 个 非常 重要 的 模块 ,提供 了 大 量 用 于 图 像 处 理 的 方法 。 使 用 
该 模块 时 ,首先 需要 导入 。 

>>> fram PIL import Image 

接 下 来 ,我 们 通过 几 个 示例 来 简单 演示 一 下 这 个 模块 的 用 法 。 

(1) 打开 图 像 文 件 。 

>>> inm Image.open('sanple.jpg') 

(2) 显示 图 像 。 


>>> im.show() 

(3) 查看 图 像 信 息 。 

>>> im.fomat # 查 看 图 像 格式 

Jm 

>>> im.size # 查 看 图 像 大 小 ,格式 为 宽度 , 高 度 ) 

(200, 100) 

>>> im.height # 查 看 图 像 高 度 

100 

>> > im.width # 查 看 图 像 宽 度 

200 

(4) 查看 图 像 直 方 图 。 

>>> im.histogram() # 如 果 图 像 包 含 多 个 通道 , 则 返回 所 有 通道 的 直方 图 
>>> im.histogram() [:256] # 查 看 第 一 个 通道 的 直方 图 

(5) 读 取 像 素 值 。 

>>> im.getpixel ((150, 80)) # 参 数 必须 是 元 组 ,两 个 元 素 分 别 表示 x 和 Y 坐 标 


(255, 248, 220) # 返 回 值 分 别 表示 红 、 绿 、 蓝 三 原色 分 量 的 值 


第 12 章 图形 编程 与 图 像 处 理 b 373 
- 


(6) 设置 像素 值 , 通 过 读 取 和 修改 图 像 像素 值 可 以 实现 图 像 点 运算 。 

»»»im.putpixel((100,50), (128,30,120)) “# 第 二 个 参数 用 来 指定 目标 像素 的 颜色 值 

LONER: 在 使 用 时 应 注意 图 像 文件 的 格式 ,这 里 演示 的 是 24 位 颜色 深度 的 图 
像 , 如 果 是 256 色 的 图 像 文件 ,那么 getpixel() 的 返回 值 只 是 一 个 数字 ,而 putpixel() 的 第 
二 个 参数 也 只 需要 一 个 数字 就 可 以 了 。 

(7) 保存 图 像 文 件 。 


>>> im.save ('samplel.pg') # 可 以 把 图 像 保 存 为 另 一 个 文件 
>>> im.save ('sample.imp') # 通 过 该 方法 也 可 以 进行 格式 转换 
>> > def imy2jpg (imgFile): # 转 换 图 像 文件 格式 


if type (imgFile)-- str and imgFile.endswith (('.kmp', '.gif', '.png!)): 
with Image.cpen (imgFile)as im: 
im.convert ('RGB') .save (ingFile[:- 3]+ 'jpg') 

»»»impjpg('l.gif') 

»»»impjpg(l.hmp') 

>>> img2jpg('1.png') 

(8) 图 像 缩放 。 

>>> im im.resize((100,100)) # 参 数 表 示 图 像 的 新 尺寸 ,分 别 表 示 宽 度 和 高 度 


(9) 旋转 图 像 ,rotate() 方 法 支持 任意 角度 的 旋转 ,而 transpose() 方 法 支持 部 分 特殊 
角度 的 旋转 ,如 90"、180"、270" 旋 转 以 及 水 平 、 垂 直 翻转 等 。 

>>> im im.rotate (90) # 逆 时 针 旋 转 90 

»»»im-im.transpose(Imege.ROTATE 180) # 逆 时 针 旋 转 180 

»»»im-im.transpose(Image.FLIP IEFT RIGHT) # 水 平 翻转 

»»»im-im.transpose(Image.FLIP TOP BOTTOM) # 垂 直 翻转 


(10) 图 像 裁剪 与 粘贴 。 


»»»box- (120, 194, 220, 294) # 定 义 裁剪 区 域 
>>> regionF im.crop (box) HR 
>>> region= region.transpose (Image.FOTATE 180) 
> > > im.paste (region, box) # 粘 贴 


例如 ,图 12-4 是 lena 图 形 , 而 图 12-5 是 将 其 中 一 部 分 逆 时 针 旋 转 180" 以 后 的 结果 ， 
请 注意 左下 角 区 域 图 像 的 变化 。 
(11) 图 像 通道 分 离 与 合并 。 


»»»r, g, b- in.split() # 将 彩色 图 像 分 离 为 同样 大 小 的 红 \ 绿 、 蓝 三 分 量子 图 
> > > imNewr Image merge (im.mode, (r,g,b)) 


(12) 创建 缩 略图 。 
»»»im.thubnail((50, 20) # 参 数 为 缩 略 图 尺寸 
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>>> im.save('2.jpg') # 保 存 缩 略图 


图 12-4 原始 lena 图 像 图 12-5 


(13) 屏幕 截图 。 


>>> fram PIL import ImageGrab 
>>> im ImageGrab.grab( (0, 0, 800, 200) ) 
>>> in ImageGrab.grab() 


(14) 图 像 增 强 。 

>>> fram PIL import ImageFilter 
»»»im-im.filter (ImageFilter.DETATL) 
»»»im-im.filter(ImageFilter.EDGE ENHANCE) 
»»»im-im.filter(ImageFilter.EDGE ENHANCE MORE) 


(15) 图 像 模 糊 。 


»»»im-im.filter(ImageFilter.BIUR) 
»»»im-im.filter (ImageFilter.GaussianBlur) 
>>> im.filter (ImageFilter.MedianFilter) 


Q6) 图 像 边缘 提取 。 
»»»im-im.filter(ImageFilter.FIND EDGES) 


(17) 图 像 点 运算 。 


>>> im-im.point (lambda i:i* 1.3) 
>>> im im.point (lanbda i:i* 0.7) 


>>> ine im.point (labda i: ix 1.8 if i< 100 else ix 0.7) 


部 分 区 域 被 旋转 180" 以 后 的 lena 图 像 


# 截 取 屏 幕 指定 区 域 的 图 像 
# 不 带 参数 表示 全 屏幕 截图 


# 创 建 滤波 器 ,使 用 不 同 的 卷 积 核 
# 边 缘 增 强 
# 边 缘 增 强 


# 高 斯 模糊 
# 中 值 滤波 


# 整 体 变 亮 
# 整 体 变 暗 
# 自 定义 调整 图 像 明暗 度 


也 使 用 图 像 增强 模块 来 实现 上 面 类 似 的 功能 ,例如 : 


>>> fran PIL import Image£rhanoe 
>>> enhr ImagsEnhance.Brightness (im) 
>>> enh.enhance(1.3) .show() 


(8) 图 像 冷 暖色 调整 。 


»»»r, g, b= im.split() 
»»»r-r.point(lambda i:ix 1.3) 
»»»g-g.point (lambda i:ix 0.9) 
»»»b-b.point (landa i:0) 
»»»im-Image.merge (im.mode, (r,g,b)) 
>>> im.show() 


(19) 图 像 对 比 度 增强 。 


>>> fram PIL import ImageEnhanoe 
>>> ine ImageEnhance.Contrast (im) 
»»»im-im.enhance(1.3) 


122 i WW TD 
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# 分 离 图 像 

# 红 色 分 量变 为 原来 的 1.318 
# 绿 色 分 量变 为 原来 的 0.9 

# 把 蓝 色 分 量变 为 0 

# 合 并 图 像 


# 对 比 度 增 强 为 原来 的 1.3 倍 


本 节 案 例 用 来 计算 和 确定 任意 形状 椭圆 的 中 心 ,使 用 pillow 扩展 库 实 现 。 


例 12-4 计算 椭圆 中 心 。 


fram PIL import Image 
import os 


def searchleft (width, height, im): 
for w in range (width) : 
for h in range (height) : 
color- im.getpixel((w, h)) 


if color != (255, 255, 255): 


retum w 


def searchRight (width, height, im): 
for w in range(width- 1, - 1, - 1): 
for h in range (height) : 
color- im.getpixel((w, h)) 


if color != (255, 255, 255): 


retum w 


df searchTop(width, height, im): 
for h in range (height— 1, -1, - 1): 

for w in range (width) : 
color= im.getpixel ( (w,h) ) 


if color != (255, 255, 255): 


retumh 


def seardiBottam(width, height, im): 


# 从 左 向 右 扫描 

# 从 下 向 上 扫描 

# 获 取 图 像 指 定位 置 的 像素 颜色 

# 遇 到 并 返回 椭圆 边界 最 左 端的 x 坐 标 


# 从 右 向 左 扫描 


# 遇 到 并 返回 椭圆 边界 最 右 端的 x 坐标 


# 巡 到 并 返回 椭圆 边界 最 上 端的 Y 坐 标 
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for h in range (height) : 
for w in range (width) : 
color- im.getpixel ( (w,h) ) 
if color != (255, 255, 255): 


retum h # 遇 到 并 返回 椭圆 边界 最 下 端的 Y 坐 标 


# 饥 历 指定 文件 夹 中 所 有 bp 图 像 文 件 , 假 设 图 像 为 白色 背景 ,椭圆 为 其 他 任意 颜色 
imags [f for f in os.listdir ('testimages')if f.endswith (' .hp')] 


for f in images: 
f= 'testimages\ \ '+ f 
ime Image.cpen (f) 
width, height= im.size # 获 取 图 像 大 小 


x0, xl= searchleft (width, height, im), searchRight (width, height, im) 
y0, yl= searchBottam(width, height, im), seardhTop(width, height, im) 
center = ( (x0 x1) //2, (yo y1) //2) 


im.putpixel (center, (255,0,0)) # 把 椭圆 中 心 像素 画 成 红色 
im.save(f[0:- 4]* ' center.hmp') # 保 存 为 新 图 像 文件 
im.close() 


123 动态 生成 比例 分 配 图 


本 节 使 用 pillow 实现 另 一 个 案例 ,具体 功能 为 : 使 用 3 种 颜色 填充 横 条 和 矩形 区 域 ,并 
在 每 段 中 分 别 居中 输出 字母 A、B、C, 要 求 A、B、C 各 自 所 占 比例 可 动态 调整 。 
例 12-5 动态 生成 比例 分 配 图 。 


fram PIL import Image, ImageDraw, ImageFont 


def redraw(f, vl, v2): 
start- int (600 * v1) 
end int (600 * v2) 


im Image.cpen (f) 
for w in range (start): # 绘 制 红色 区 域 
for h in range (36, 61): # 具 体 数值 需要 根据 图 片 大 小 进行 调整 
im.putpixel((w,h), (255, 0, 0)) 
for w in range(start, end): # 绘 制 绿色 区 域 


for h in range(36, 61): 
ám.putpixel ((w,h), (0, 255, 0)) 
for w in range (end, 600): # 绘 制品 红色 区 域 
for h in range (36, 61): 
im.putpixel ((w,h), (255, 0, 255)) 
draw- ImageDraw.Draw (im) 
font- ImageFont.truetype ('simsun.ttc', 18) 
draw.text ((start//2,38), 'A', (0,0,0), font font) 
# 在 各 自 区 域内 居中 显示 字母 
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draw.text ( ( (end- start) //2+ start,38), 'B', (0,0,0), font= font) 
draw.text (((600- end) //2* end, 38) , 'C', (0,0,0), font= font) 
im.save(f) # 保 存 图 片 


redraw (z'd: Voiaotoul.png', 0.1, 0.9) 


程序 运行 结果 如 图 12-6 所 示 。 图 中 上 面 浅 蓝 色 部 分 的 百分比 和 文字 描述 是 提前 做 
好 的 ,下 面 3 种 颜色 的 矩形 区 域 和 A B.C 是 由 本 程序 动态 生成 ,可 以 根据 图 片 大 小 修改 
代码 中 的 数值 。 


pe—T 


图 12-6 比例 分 配 图 


1224 生成 验证 码 图 片 


验证 码 在 网 络 应 用 开发 中 占有 重要 地 位 ,广泛 应 用 于 用 户 注册 、 登 录 、 留 言 、 购 物 、 网 
络 支 付 等 场合 ,可 以 有 效 阻止 恶意 用 户 频繁 的 非法 数据 提交 。 图 片 验证 码 是 比较 传统 的 
验证 码 形式 ,图 片 中 除了 经 过 平移 .旋转 、 错 切 、 缩 放 等 基本 变换 的 字母 和 数字 之 外 ,还 有 
一 些 线条 或 其 他 干扰 因素 。 另 外 ,还 有 问答 型 验证 码 ,验证 码 是 一 个 简单 的 问题 ,用 户 需 
要 输入 正确 的 答案 才能 进行 后 续 的 操作 。 某 些 系 统 的 验证 码 系统 更 加 复杂 ,实现 了 基于 
内 容 的 图 像 识 别 功能 甚至 拼图 功能 ,题目 难度 较 大 ,在 一 定 程度 上 也 阻碍 了 用 户 的 正常 
使 用 。 

例 12-6 生成 验证 码 图 片 。 


from PIL import Image, ImageDraw, ImageFont 
import randcm 
ámport string 


# 所 有 可 能 的 字符 ,主要 是 英文 字母 和 数字 
characters- string.ascii letterst string.digits 


# 获 取 指 定 长 度 的 字符 串 
def selectedcharacters (length) : 
"length:the nurber of characters to show' 
result- " 
for i in range (length) : 
result += randan.choice (characters) 
return result 


def getColor(): 
'''get a randm color''' 
r= randan.randint (0,255) 
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g= randm. randint (0, 255) 
b= randm. randint (0,255) 
retum (r,g,b) 


def main(size- (200,100), characterNumber- 6, bgcolor= (255,255,255) ) : 
imageTempr Image.new('RGB', size, bgoolor) 
# 设 置 字体 和 字号 
font- ImageFont .truetype ('c:\ \windows\ \ fonts\ \TIMESBD.TIF', 48) 
draw- ImageDraw. Draw (imageTerp) 
text= selectedcharacters (characterNunber) 
width, height= draw.textsize(text, font) 
# 绘 制 验证 码 字符 串 
offset-2 
for i in range (CharacterNunber) : 
offset * - width//characterNumber 
position = (offset, (size[1]- height) //2* randam.randint (- 10,10) ) 
draw.text(xy- position, text- text[i], font- font, fill- getColor()) 
# 对 验证 码 图 片 进行 简单 变换 ,这 里 采用 简单 的 点 运算 
imageFinal- Imege.new('RGB', size, bgcolor) 
pixelsFinal- imageFinal.load() 
pixelsTemp- imageTemp. load () 
for y in range(0, size[1]): 
offset- randam.randint (- 1,1) 
for x in range(0, size[0]) : 
newx- xt offset 
if newx> = size[0] : 
newx- size[0]- 1 
elif newx< 0: 
newx- 0 
PixelsFinal [newx, y]- pixelsTemp[x, y] 
draw= ImageDraw.Draw (imageFinal) 
# 绘 制 干扰 噪点 像素 
for i in range (int (size[0] * size[1] * 0.07)) : 
draw.point ( (random. randint (0, size[0]), randcm.randint (0,size[1])), fill= getColor()) 
# 绘 制 干扰 线条 
for i in range (8): 
start = (0, randam.randint (0, size[1]- 1)) 
end = (size[0], randam.randint (0, size[1]- 1)) 
draw.line([start, end], fill-getColor(), width- 1) 
# 绘 制 干扰 弧 线 
fori in range(8): 
start = (- 50, - 50) 
end = (size[0]* 10, randcm.randint(0, size[1]* 10)) 
draw.arc(startt end, 0, 360, fill- getOolor()) 
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main ( (200,100), 8, (255,255,255) ) 


将 上 面 的 程序 保存 并 运行 , 即 可 生成 验证 码 图 片 ,如 图 12-7 所 示 。 


eee gn 


(a) 验证 码 图 片 (一 (b 验证 码 图 片 (二 ) (c) 验证 码 图 片 (三 ) 
图 12-7 验证 码 图 片 


1225 gf 动态 图 像 分 离 与 生成 


GIF(Graphics Interchange Format) 是 比较 常见 的 一 种 动态 图 像 , 在 一 个 文件 中 可 以 
存储 多 幅 图 像 , 把 这 些 图 像 依次 读 出 并 显示 ,可 以 得 到 简单 的 动画 效果 , 因 其 体积 较 小 并 
且 清 晰 度 还 不 错 而 得 到 广泛 应 用 ,大 家 在 网 上 见 到 的 很 多 搞笑 动态 图 片 都 是 GIF 格 
式 的 。 

例 12-7 GIF 动态 图 像 分 离 与 生成 。 

下 面 的 代码 可 以 把 动态 图 像 test. gif 分 离 得 到 每 帧 图 片 : 


fram PIL import Image 
import os 


# 使 用 Image 模 块 的 cben() 方 法 打开 GIF 动态 图 像 时 ,默认 是 第 一 帧 
ime Image.cpen (gi fFileName) 

Engpir= gifFileName[:- 4] 

# 创 建 存放 每 帧 图 片 的 文件 夹 

os.mkdir (pngDir) 


try: 
while True: 
# 保 存 当前 帧 图 片 
current- im.tell() 
im.save (pngDirt '\\ '+ str (current) *- ' png?) 
# 获 取 下 一 帧 图 片 
im.seek(current+ 1) 
except FOFError: 
pass 
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下 面 的 代码 可 以 把 上 面 代码 分 离 GIF 文件 得 到 的 所 有 png 图 像 文件 再 重新 合并 为 
一 个 GIF 文件 ,如 果 无 法 正常 执行 的 话 , 除 了 需要 使 用 pip 安装 images2gif 扩展 库 , 很 可 
能 还 需要 找到 扩展 库 images2gif 的 主 文件 images2gif. py, 然 后 把 第 426 行 代码 


palettes append (getheader (im) [1]) 
改 为 
palettes.append (im.palette.getdata () [1]) 
然后 再 执行 下 面 的 程序 : 
import os 
import os.path 


fram PIL import Image 
à : gif 


def pngs2gif (gifName, path, duration- 0.1, np- 0.1): 
pngFiles- [f for f in os.listdir (path)] 
pngFiles.sort (key= lambda f: int(f[:- 4])) 
pngFiles- [os.path.join(path, f)for f in pngFiles] 
images- [] 
for f in pngFiles: 

images .append (Image .open (f) ) 
images?gif.writeGif (gifNeme, images, duration, np) 


Eros ("abc.gif*, "test*) 
126 材质 巾 


在 12.1. 3 节 中 介绍 了 计算 机 图 形 学 中 的 纹理 映射 ,通过 纹理 映射 或 者 材质 贴图 可 以 
让 同一 个 表面 呈现 出 不 同 的 视觉 效果 。 在 贴图 时 ,很 难保 证 原始 图 片 丛 好 和 目标 物体 表 
面 的 尺寸 完全 相同 ,这 时 候 就 必须 要 对 原始 图 片 进 行 必 要 的 缩放 和 像素 采样 。 

例 12-8 把 固定 大 小 的 图 片 进行 缩放 并 映射 到 任意 大 小 物体 表面 。 

fram PIL import Image 

frammath import floor 


def textureMsp (srcTextureFile, dstSurfaccFile, dstWidth, dstHeight): 
"srcTextureFile: 原 始 图 片 
dstsurfacegile: 模 拟 目标 物体 表面 
dstwidth: 目 标 物体 表面 宽度 
dstHeight: 目 标 物体 表面 高 度 


# 打 开 原始 图 片 


SrcTexturer Image.cpen (srcTextureFile) 
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# 创 建 指定 尺寸 的 目标 物体 表面 
dstSurface- Image.new ('RGBA' , (dstWidth, dstHeight)) 
srdWidth, srcHeight- srcTexture.size 
# 根 据 目 标 物体 表面 尺寸 ,计算 并 获取 原始 图 片 中 对 应 位 置 的 像素 值 
for w in range (dstWidth) : 
for h in range (dstHeight) : 

X, y= floor (w/dstWidth * srdWidth), floor (h/dstHeight * srcHeight) 

dstSurface.putpixel((w,h), srcTexture.getpixel ( (x,y) )) 
dstSurface.save (dstSurfaceFile) 
dstSurface.close () 
srcTexture.close () 
# 也 可 以 尝试 下 面 的 写法 ,更 简单 一 些 


srcTexture= Image.open (srcTextureFi le) 

srcTexture- srcTexture. resize ( (dstWidth, dstHeight) ) 
SrcTexture.save (dstSurfaceFile) 

srcTexture.close|() 


# 测 试 
textureMap ('sample.jpg'， r'new.jpg', 200, 250) 


127 图 像 融合 


图 像 融 合 (Image Fusion) 是 指 将 多 源 信 道 所 采集 到 的 关于 同一 目标 的 图 像 数 据 经 过 
图 像 处 理 和 计算 机 技术 等 ,最 大 限度 地 提取 各 自信 道中 的 有 利信 息 ,最 后 综合 成 高 质量 的 
图 像 , 提 高 图 像 信 息 的 利用 率 、 改 善 计算 机 解 译 精度 和 可 靠 性 、 提 升 原始 图 像 的 空间 分 辨 
率 和 光谱 分 辩 率 ,利于 监测 。 待 融合 源 图 像 必须 已 配 准 并 且 像素 位 宽 一 致 的 ,和 否则 会 影响 
融合 效果 。 

图 像 融合 技术 可 以 简单 地 分 为 像素 级 融合 .特征 级 融合 和 决策 级 融合 。 像 素 级 融合 
又 有 空域 融合 算法 和 变换 域 融合 算法 ,下 面 的 代码 演示 了 空域 融合 算法 的 一 种 ,也 就 是 灰 
度 加 权 平 均 法 。 

例 12-9 使 用 pillow 进行 图 像 空域 融合 。 

fram random import randint 

fram PIL import Trage 


# 根 据 原始 24 位 色 BMP 图 像 文件 ,生成 指定 数量 含有 随机 噪点 的 临时 图 像 
def addNpise (fileName, num): 
if not fileName.endswith (' Emp") : 
print (Must be imp image") 
retum 
for i in range(num): 
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im- Inage-apen (fileName) 
width, height= im.size 
m= randint (1, 20) 
for j in range (n): 
w-randint(0, width- 1) 
h-randint (0, height- 1) 
ám.putpixel ( (wh) , (0,0,0)) 
im.save(fileNeme[:-4]t '_'+ str (i+ 1)+ '.mp') 


# 根 据 多 个 含有 随机 噪点 的 图 像 ,对 应 位 置 像素 计算 平均 值 ,生成 结果 图 像 
def mergeOne (fileName, num) : 
if not fileName.endswith (' kr") : 
print ('Mast be imp image!) 
retum 
ims- [Image.cpen(fileName[:- 4]* '_'+ str (i+ 1)+ '.bmp')for i in range (num) ] 
ime Image.new('RGB', ims[0].size, (255,255,255)) 
for w in range (im.size[0]) : 
for h in range (im.size[1]) : 
r, g, b- [0] * 3 
for tempIm in ims: 
value= tempIm.getpixel ( (w,h) ) 
r-*-value[0] 
g *-value[1] 
b *-value[2] 
r-r//num 
g- g//num 
b-b//num 
im.putpixel ( (w,h), (z,g,b)) 
im.save(fileName[:- 4]+ ' result.hmp') 


# 对 比 合并 后 的 图 像 和 原始 图 像 之 间 的 相似 度 
def ccmpare (fileName) : 
iml= Image.open (fileName) 
im Image.open (fileName[:- 4]+ ' result.hmp') 
width, height= iml.size 
total-width * height 
right-0 
expectedRatio- 0.05 
for w in range (width) : 
for h in range (height) : 
rl, gl, bl= iml.getpixel ((w,h)) 
12, g2, b% in?.getpixel ( (w,h) ) 
if(abs (r1- x2) , abs (gl- g2) ,abs (b1- b2) )« (255* expectedRatio,) * 3: 
right +=1 
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HER 32 个 临时 图 像 ,然后 进行 融合 ,并 对 比 融 合 后 的 图 像 与 原始 图 像 的 相似 度 
addNoise('test.hmp' 32) 

mergeOne ('test .bmp', 32) 

result- ompare('test .bmp') 

print ("Total number of pixels:(0[0]), right number: (0[1]) ' .£ormat (result)) 


128 棋盘 纹理 生成 


国际 象棋 棋盘 由 8 行 8 列 黑白 相间 的 颜色 区 域 组 成 , 共 64 个 小 格子 。 在 制作 棋盘 纹 
理 时 ,首先 生成 一 个 指定 大 小 的 白色 图 像 ,然后 再 进行 区 域 颜色 的 填充 。 代 码 运行 成 功 
后 ,会 在 当前 文件 夹 中 生成 图 像 文件 qipan. jpg. 

例 12-10 使 用 pillow 生成 国际 象棋 棋盘 纹理 。 


fram PIL import Image 


def gipan(fileName, width, height, colorl, color2): 
# 生 成 空白 图 像 
ine Image.new ('RGB', (width, height)) 
for h in range (height) : 
for w in range (width) : 
# 填 充 颜色 交叉 的 图 案 
if (int h/height * 8)+ int (w/width * 8))$2 ==0: 
im.putpixel((w,h), colorl) 
else: 
ám.putpixel((w,h), color2) 
# 保 存 图 像 文件 
ám.save (fileName) 
if nme --' main ': 
fileName- 'qipan. jpg" 
qipan(fileName, 500, 500, (128,128, 128) , (10,10,10) ) 
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用 于 数据 分 析 与 科学 计算 可 视 化 的 Python 模块 非常 多 ,如 numpy, scipy, pandas, 
statistics, matplotlib,sympy traits, traitsUI, Chaco, TVTK, Mayavi, VPython, OpenCV, 
其 中 ,numpy 模块 是 科学 计算 包 , 提 供 了 Python 中 没有 的 数组 对 象 ,支持 N 维 数组 运算 、 
处 理 大 型 矩阵 、 成 熟 的 广播 函数 库 \ 矢 量 运 算 、 线 性 代数 、 傅 里 叶 变 换 以 及 随机 数 生成 等 功 
能 ,可 与 C++ FORTRAN 等 语言 无 颖 结合 , 树 莓 派 Python v3 默认 安装 就 已 包含 了 
numpy. scipy 模块 依赖 于 numpy ,提供 了 更 多 的 数学 工具 ,包括 矩阵 运算 、 线 性 方程 组 求 
解 、 积 分 、 优 化 等 。matplotlib 是 比较 常用 的 绘图 模块 ,可 以 快速 地 将 各 种 计算 结果 以 各 
种 图 形 形 式 展示 出 来 。 大 部 分 扩展 库 都 可 以 使 用 pip 命令 直接 安装 ,如 果 有 不 能 安装 或 
者 安装 之 后 无 法 正常 工作 的 扩展 库 , 可 以 登录 下 面 的 网 页 选择 合适 的 版 本 下 载 和 安装 , 


http://www. lfd.uci.edu/~ gchlke/pythonlibs/ 


13.1 扩展 库 numpy 简介 


根据 Python 社区 的 习惯 ,首先 使 用 下 面 的 方式 来 导入 numpy 模块 : 


»»»import numpy as np 


1. 生成 数组 

»»»rnp.array((, 2, 3, 4, 5)) HE Python 列表 转换 成 数组 
array([1, 2, 3, 4, 5]) 

»»»np.array (range (5)) # 把 Python 的 range 对 象 转换 成 数组 


array([0, 1, 2, 3, 4]) 
>>>np.array([[l, 2, 3], (4, 5, 611) 
array([[l, 2, 3], 
[4 5, 611) 
»»»mnp.linspace (0, 10, 11) # 生 成 等 差 数组 
amay([0., 1. 2. 3, 4, 5, 6, 7, 8., 9, 1] 
»»»np.linspace(0, 1, 11) 
array([ 0., 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.]) 
»»»rnp.logspace(0, 100, 10) # 对 数 数组 


array([  1.00000000e* 000, 
2.15443469e 033, 
4.64158883e^ 066, 
1.00000000e 100]) 


»»»np.zeros( 


I[0. 0. 0.] 
LO. 0. 0.] 
LO. 0. 0.] 


»»»np.zeros( 
array (LL 0.1, 
0.1, 
0.1) 


»»»np.zeros( 


G3) 


1 
3,1) 


(3) 


array([[ 0., 0., 0.]]) 
»»»np.ones((3,3)) 
array([[1., 1., 1.], 

l, l1, 1), 

1., 1., 1.]]) 
»»»np.ones((1,3)) 
array([[1., 1., EI 
»»»np.identity(3) 
array([[1., 0., 0.], 

0., 1., O0.], 

0., O., 1.]]) 
»»»np.identity (2) 
array([[1., 0.], 

0, 1] 
>>>mP-empty((3,3)) 
array([[ 0., 0., 0.], 

0., O., O.], 

0., 0., 0.]]) 


2. 数组 与 数值 的 算术 运算 


»»»x-np.array((1, 2, 3, 4, 5)) 


>>>x 


array([1, 2, 3, 4, 5]) 


>>>x* 2 


array([ 2, 4, 6, 8, 10]) 


»»»2x/2 


array([ 0.5, 1. , 1.5, 2. , 2.5]) 


»»»x//2 


array([0, 1, 1, 2, 2], dtype- int32) 


2»»x** 3 


1.29154967e* 011, 
2.78255940e* 044, 
5.99484250et 077, 
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1.66810054et 022, 
3.59381366e* 055, 
71.14263683e* 088, 


# 全 0 二 维 数组 


# 全 0 一 维 数组 


# 全 1 二 维 数组 


# 全 1 一 维 数组 


# 单 位 矩阵 


# 空 数组 ,只 申请 空间 而 不 初始 化 ,元 素 值 是 不 确定 的 


# 创 建 数组 对 象 


# 数 组 与 数值 相 乘 ,所 有 元 素 与 数值 相 乘 
# 数 组 与 数值 相 除 
# 数 组 与 数值 整除 


UR 
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* 
array([1, 8, 27, 64, 125], dtype- int32) 
>>>x+2 # 数 组 与 数值 相 加 
array([3, 4, 5, 6, 7]) 
>>>x %3 # 余 数 


array([1, 2, 0, 1, 2], dtype- int32) 


3. 数组 与 数组 的 算术 运算 


»»»a-np.array((1, 2, 3)) 
»»»b-np.array(([1, 2, 3], [4, 5, 6], (7, 8, 91) 


»»»ca* b # 数 组 与 数组 相 乘 
>>>c #a 中 的 每 个 元 素 乘 以 b 中 的 每 一 列 元 素 
array([[ 1, 4, 9], 

4, 10, 18], 

7, 16, 27]]) 
»»»c/b # 数 组 之 间 的 除法 运算 
array([[1., 2., 3.], 

la 2y 3h 

£a 2 3B 
»»»c/a 
array([[1., 2., 3.], 

4. Soy 64 

Jus 8: 2:931) 
»»»ata # 数 组 之 间 的 加 法 运算 
array([2, 4 6) 
>>>a* a # 数 组 之 间 的 乘法 运算 
array([1，4，9]) 
»»»a-a # 数 组 之 间 的 减法 运算 
array([0, 0, 0]) 
»»»a/a # 数 组 之 间 的 除法 运算 


4. 二 维 数组 转 置 


»»»b-mp.array(([1, 2, 3], (4, 5, 6], (7, 8, 9) 
>>>b 
array([[l, 2, 3], 

[4, 5, 6j, 

U, 8, 9]]) 
>>>b.T # 转 置 
array([[l, 4, 7], 

[2, 5, 8], 

[3, 6, 911) 
»»»a-mp.array((1, 2, 3, 4)) 


>>>a 

array([1, 2, 3, 4]) 
»»»a.T 

array([1, 2, 3, 4]) 


5. 向 量 内 积 


»»»a-np.array((5, 6, 7)) 
»»»b-np.array((6, 6, 6)) 
»»»a.dot(b) 

108 

»»»np.dt (a,b) 

108 
»»»oc-rp.array((1,2,3], [4,5,6], [7,8,9])) 
»»»cI-c.T 

»»»c.dot (a) 

array([ 38, 92, 146]) 
»»»c[0].dot (a) 

38 

»»»c[1].dot (a) 

92 

»»»c[2].dot (a) 

146 

»»»a.dot(c) 

array([ 78, 96, 114]) 
>>>a.dot (cT[0]) 

78 

»»»a.dot(cT[1]) 

96 

»»»a.dot (cT[2]) 

114 


6. 数组 元 素 访问 


»»»b-np.array (([1,2,3], [4,5,6], [7,8,9])) 


>>>b 

array([[ 2, 3], 
I4, 5, 6j, 
U, 8, 91) 

>>>b[0] 

array([1, 2, 3]) 

>>>b[0][0] 

工 
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# 一 维 数组 转 置 以 后 和 原来 是 一 样 的 


# 向 量 内 积 


# 二 维 数组 
# 转 置 
# 二 维 数组 的 每 行 与 一 维 向 量 计算 内 积 


# 两 个 一 维 向 量 计算 内 积 


# 一 维 向 量 与 二 维 向 量 的 每 列 计算 内 积 


EB 0 行 


VB 0 行 第 0 列 的 元 素 值 


数组 元 素 还 支持 多 元 素 同时 访问 ,例如 : 


388 
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»»»x-np.arange(0, 100, 10, dtype- rp.floating)  # 创 建 等 差 数 组 
>>>x 


array([0., 10., 20., 30., 40., 50., 60., 70., 80., 90.]) 


>>> index- np.randan.randint (0, len (x), 5) # 生 成 5 个 随机 整数 作为 下 标 
»»»index 

array ([5, 4, 1, 2, 9]) 

»»»x[indx] # 同 时 访问 多 个 元 素 的 值 
array([50.，40.，10.，20.，90.]) 

>>>x[index]= [1, 2, 3, 4, 5] # 同 时 修改 多 个 下 标 指定 的 元 素 值 
>>>x 

array([0., 3., 4., 30., 2., 1., 60., 70., 80., 5.]) 

»»»x[[L2,3]] # 同 时 访问 多 个 元 素 的 值 


array([3.，4.，30.]) 


7. 对 数组 进行 函数 运算 


»»»x-mp.arange(0, 100, 10, dtype- rp. floating) 
>>>np.sin (x) # 一 维 数组 中 所 有 元 素 求 正弦 值 
array([ 0. , —0.54402111, “0.91294525，- 0.98803162, 0.74511316, 
—0.26237485, —0.30481062, 0.77389068, —0.99388865,  0.89399666]) 

»»»be-np.array(([1, 2, 3], (4, 5, 6], (7, 8, 9) 
>>>np.cos (b) # 二 维 数组 中 所 有 元 素 求 余 弦 值 
array([[ 0.54030231，- 0.41614684，- 0.9899925 ], 

[- 0.65364362, 0.28366219, 0.96017029], 

[ 0.75390225，- 0.14550003, — 0.91113026]]) 
»»»np.round( ) SUE TA 
array([[ 1., -0., -1.], 

[1, 0, 1], 

[1., -0., -1.]]) 
»»»x-np.randan.rand(10) # 包 含 10 个 随机 数 的 数组 
»»»x-x* 10 
>>>x 
array([6.03635335, 3.90542305, 0.05402166, 0.97778005, 8.86122047, 

8.60849771, 8.43456386, 6.10805351, 1.01185534, 5.52150462]) 


»»»rnp.floor (x) # 所 有 元 素 向 下 取 整 
array([6., 3., 0., 0., 8., 8., 8., 6., 1., 5.]) 
»»»np.ceil(x) # 所 有 元 素 向 上 取 整 


array([7., 4., 1., 1., 9., 9., 9., 7., 2., 6.]) 


8. 对 矩阵 不 同 维度 上 的 元 素 进行 计算 


>>> np.arange (0, 10) .reshape (2,5) # 创 建 二 维 数组 
>>>x 


array([[0, 1, 2, 3, 4], 


I5, 6, 7, 8, 9]]) 
»»»np.sum(x) 
45 
»»»np.sum(x, axis-0) 
array([5, 7, 9, 1, 13]) 
»»»np.sum(x, axis- 1) 
array([10, 35]) 
»»»np.mean(x, axis- 0) 
array([2.5, 3.5, 4.5, 5.5, 6.5]) 
»»»weight- [0.3, 0.7] 
»»»np.average (x, axis- 0, weights- weight) 
array([3.5, 4.5, 5.5, 6.5, 7.5]) 
»»»np.max(x) 
9 
»»»np.mex(x, axis- 0) 
array([5, 6, 7, 8, 9]) 
»»»x-np.random.randint (0, 10, size- (3,3)) 
>>>x 
array([[4, 9, 1], 
U, 4, 9], 
[8, 9, 11) 
»»»np.std(x) 
3.1544599036840864 
»»»np.std(x, axis-1) 
array([3.29983165, 2.05480467, 3.55902608]) 
»»»np.var(x, axis- 0) 
array([2.88888889, 5.55555556, 14.22222222]) 
»»»np.sort(x, axis- 0) 
array (L(4, 4, 1], 
U, 9, 1, 
I8, 9, 9]]) 
»»»np.sort(x, axis-1) 
array (LU, 4, 9], 
[4, 7, 9], 
[ 8, 91) 


9. 改变 数组 大 小 


»»»a-np.arange (1l, 11, 1) 

>>>a 

array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) 
»»»a.shape-2, 5 

>>>a 


amay([[1, 2, 3, 4 5], 


第 13 章 数据 分 析 与 科学 计算 可 视 化 b 389 
e 


# 二 维 数组 所 有 元 素 求 和 

# 二 维 数组 纵向 求 和 

# 二 维 数组 横向 求 和 

# 二 维 数组 纵向 计算 算术 平均 值 


# 权 重 
# 二 维 数 组 纵向 计算 加 权 平均 值 


# 所 有 元 素 最 大 值 
# 每 列 元 素 的 最 大 值 


# 创 建 二 维 数组 


# 所 有 元 素 的 标准 差 
# 每 行 元 素 的 标准 差 
# 每 列 元 素 的 标准 差 


# 纵 向 排序 


# 横 向 排序 


# 改 为 2 行 5 列 
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[6 7, 8, 9, 10]]) 
»»»a.shape-5, -1 #-1 表 示 自 动 计算 
>>>a 
array([[ 1, 2], 

[3, 4, 

[5, g, 

[7, 8, 

[ 9, 10]]) 
»»»b-a.reshape (2,5) #reshape() 方 法 返回 新 数组 
>>>b 
array([[1, 2, 3, 4 5], 

[6 7, 8, 9, 10]]) 


10. 切片 操作 


»»»a-np.arange (10) 

>>>a 

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 

»»»a[:-1] # 反 向 切片 
array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0]) 

>>>a[::2] # 隔 一 个 取 一 个 元 素 
array([0, 2, 4, 6, 8]) 

»»»a[:5] # 前 5 个 元 素 
array([0, 1, 2, 3, 4]) 

»»»c-np.arange (25) # 创 建 数组 
>>>c.shape= 5,5 # 修 改 数组 大 小 


>>>C 


array([[0, 1, 2, 3, 4], 
[9; € 4" &. 9 
[10, 11, 12, 13, 14], 
[15, 16, 17, 18, 19], 
[20, 21, 22, 23, 24]]) 


»»»cl0, 2:5] # 第 0 行 中 下 标 [2,5) 之 间 的 元 素 值 

array([2, 3, 4]) 

»»»clll # 第 0 行 所 有 元 素 

array([5, 6, 7, 8, 9]) 

»»»c[2:5, 2:5] # 行 下 标 和 列 下 标 都 介 于 [2,5) 之 间 的 元 素 值 


array([[12, 13, 14], 
[17, 18, 19], 
[22, 23, 24]]) 


l1. 布尔 运算 


2» »x-np.randam.rand(10) # 包 含 10 个 随机 数 的 数组 
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array([ 0.56707504, 0.07527513, 0.014913,  0.49157657, 0.75404095, 
0.40330683, 0.90158037, 0.36465894, 0.37620859, 0.62250594]) 


»»»30.5 # 比 较 数组 中 每 个 元 素 值 是 否 大 于 0.5 
array([ Træ, False, False, False, True, False, True, False, False, True], dtype- bool) 
»»»x[ 0.5] # 获 取 数 组 中 大 于 0.5 的 元 素 


array([0.56707504, ”0.75404095， ”0.90158037， 0.62250594]) 

»»»a-np.array([1, 2, 3]) 

»»»b-np.array([3, 2, 1]) 

»»»2b # 两 个 数组 中 对 应 位 置 上 的 元 素 比较 
array([False, False, True], dtype- bool) 

»»»a[a»b] 

array([3]) 

>>>a== 

array([False, True, False], dtype= bool) 

»»»a[a--b] 


array([2]) 


12. 广播 


»»»a-np.arange (0, 60,10) .reshape (- 1,1) # 列 向 量 
»»»b-rnp.arange (0,6) # 行 向 量 
>>>a 
array([[ 0], 

[10], 

[20], 

[30], 

[40], 

[50]]) 
>>>b 
array([0, 1, 2, 3, 4, 5]) 
»»»atb LN 
array([[0, 1, 2, 3, 4 5], 

[10, 11, 12, 13, 14, 15], 

[20, 21, 22, 23, 24, 25], 

[30, 31, 32, 33, 34, 35], 

[40, 41, 42, 43, 44, 45], 

[50, 51, 52, 53, 54, 55]]) 


>>>a* b 

array([[ Oo, 0, 0, 0, 0 0, 
[ 0, 10, 20, 30, 40, 50], 
[ 0, 20 40, 60, 80, 100], 
[0 3, 6, 9, 120, 150], 
[ 0, 40, 80, 120, 160, 200], 


392 
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[ 0, 50, 100,150, 200, 250]]) 


13. 分 段 函 数 


»»»x-np.randm.randint(0, 10, size- (1,10)) 

>>>x 

array([[0, 4, 3, 3, 8, 4, 7, 3, 1, 7]]) 

»»»rnp.where (« 5, 0, 1) # 小 于 5 的 元 素 值 对 应 0, 其 他 对 应 1 
array([[0, 0, 0, 0, 1, 0, 1, 0, 0, 1]]) 

# 小 于 4 的 元 素 乘 以 2, 大 于 7 的 元 素 乘 以 3, 其 他 元 素 变 为 0 

>>> np.piecewise (x, [X< 4, x» 7], [1anbda x:x* 2/1arbda x:x* 3]) 

arey([[0, 0, 6, 6,24, 0 0, 6 2, Ol) 


14. 计算 唯一 值 以 及 出 现 次 数 


»»»x-np.randm.randint (0,10, 7) 

»»»x 

array([8, 7, 7, 5, 3, 8, 0]) 

»»»np.bincount (x) # 元 素 出 现 的 次 数 ,0 表示 出 现 1 次 

array ([1, 0, 0, 1, 0, 1, 0, 2, 3]，dtype= int64) #].2 表 示 没 出 现 ,3 表 示 出 现 1 次 ,以 此 类 推 
>>>np.sm(_) # 所 有 元 素 出 现 次 数 之 和 等 于 数组 长 度 

P 

>>> len(x) 

3 

»»»np.unique (x) # 返 回 唯一 元 素 值 

array([0, 3, 5, 7, 8]) 

»»»x-np.randm.randint (0, 10,2) 

>>>x 

array([2, 1]) 

»»»np.bincount (x) # 结 果 数 组 的 长 度 取决 于 原始 数组 中 最 大 元 素 值 
array([0, 1, 1], dtype- int64) 

»»»x-mnp.randm.randint(0, 10, 10) 


>>>x 

array([3, 6, 4, 5, 2, 9, 7, 0, 9, 0]) 

>>> y-np.randam.rand (10) # 随 机 小 数 ,模拟 权重 
»»»y-mp.romd (y, 1) # 保 留 一 位 小 数 

>>>y 

array([ 0.6, 0.8, 0.8, 0., 0.6, 0.1， 0., 0.2, 0.8, 0.7]) 

>>>np.sm(x* y)/np.sum(np.bincount (x) ) # 加 权 总 和 /出 现 总 次 数 或 元 素 个 数 


2.9199999999999999 


15. 矩阵 运算 


>>>a list- [3, 5, 7] 
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>>>a mat-rp.matrix(a list) HUER 
>>>a mt 
matrix ([[3, 5, 7]]) 
>>>a mat.T HERRE 
matrix ([[3], 
[5], 
Un 
>>>a mat.shape HERJAR 
(1, 3) 
>>>a mat.size 
3 
>>>b mat-np.matrix((l, 2, 3)) 
>>>b mat 
matrix([[1, 2, 3]]) 
>>>a mat * b mat.T # 和 矩阵 相 乘 
matrix ([[34]]) 
>>>a mat.mean() # 元 素平 均值 
5.0 
»»»a mat.sun() # 所 有 元 素 之 和 
15 
»»»a mat.mex() 
7 


»»»c mat=np.matrix([[1, 5, 3], (2, 9, 611) HURE 
>>>c mt 
matrix([[1, 5, 3], 
[2, 9, 6 
>>>c mat.argsort (axis= 0) # 纵 向 排序 后 的 元 素 序号 


matrix([[0, 0, 0], 
U, 1, 1]], dtype- inte4) 
»»»c mat.argsort (axis- 1) # 横 向 排序 后 的 元 素 序号 
matrix([[0, 2, 1], 
[0, 2, 1]], dtype- inte4) 
»»»d mat rp.matrix([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) 


»»»d mat.diagonal () # 和 矩阵 对 角 线 元 素 
matrix([[1, 5, 9]) 
>>>d mat.flatten() # 和 矩阵 平 铺 


matrix([[1, 2, 3, 4, 5, 6, 7, 8, 9]]) 


13.2 科学 计算 扩展 库 scipy 


scipy 是 专门 为 科学 计算 和 工程 应 用 设计 的 Python 工具 包 , 在 numpy 的 基础 上 增加 
了 大 量 用 于 科学 计算 以 及 工程 计算 的 模块 ,包括 统计 、 优 化 整合、 线性 代数 、 常 微分 方程 
数值 求解 、 信 号 处 理 、 图 像 处 理 、 稀 朴 矩 阵 等 。scipy 工具 包 的 主要 模块 如 表 13-1 所 示 。 
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表 13-1 scipy 工具 包 的 主要 模块 

模 块 说 明 
constants 常数 
special 特殊 函数 
0 数值 优化 算法 ,如 最 小 二 乘 拟 合 (leastsq) 、 函 数 最 小 值 (fmin 系列 )、 非 线性 方程 组 求 

解 (fsolve) 等 

interpolate 插值 (interpld ,interp2d 等 ) 
integrate 数值 积分 
signal 信和 号 处 理 

A 图 像 处 理 , 包 括 滤波 器 模块 filters、 傅 里 叶 变换 模块 fourier、 图 像 插值 模块 
interpolation, El f£ W ft Et measurements ,形态 学 图 像 处 理 模块 morphology 等 
stats 统计 
misc 提供 了 读 取 图 像 文件 的 方法 和 一 些 测试 图 像 


io 


提供 了 读 取 Matlab 和 Fortran 文件 的 方法 


1321 数学 .物理 常用 常数 与 单位 模块 constants 


scipy 工具 包 的 常数 模块 constants 包含 大 量 用 于 科学 计算 的 常数 ,下 面 给 出 其 中 几 
个 ,更 多 的 可 以 查看 http://docs. scipy. org/doc/scipy/reference/constants. html, 
例如 ,可 以 使 用 下 面 的 方法 来 访问 该 模块 中 预定 义 的 常数 。 


>>> fram scipy import constants as C 


>>>C.pi # 圆 周 率 
3.141592653589793 

»»»C.golden # 黄 金 比例 
1.618033988749895 

»»»C.c # 真 空中 的 光速 
299792458.0 

>>>C.h # 普 朗 克 常 数 
6.62606896e- 34 

»»»Cmile # 一 英里 等 于 多 少 米 
1609.3439999999998 

>>>C.inch # 一 英寸 等 于 多 少 米 
0.0254 

»»»C.degree # 一 度 等 于 多 少 弧度 


0.017453292519943295 


»»»Cminute # 一 分 钟 等 于 多 少 秒 
60.0 
»»»C.g # 标 准 重 力 加 速度 


9.80665 
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1322 特殊 函数 模块 special 
scipy 工具 包 的 special 模块 包含 了 大 量 函 数 库 , 包 括 基本 数学 函数 和 很 多 特殊 函数 。 


> > > fra scipy inport special as S 
»»»8.dbrt (8) # 立 方 根 

2.0 

»»»S.expl0(3) $03 

1000.0 

»»»S.sindg(90) # 正 弦 函 数 ,参数 为 角度 
1.0 

>>>S.round(3.1) # 四 含 五 人 函数 

3.0 

>>>S.round(3.5) 

4.0 

>>> S.round(3.499) 

3.0 

»»»8S.omb(5,3) # 从 5 个 中 任 选 3 个 的 组 合 数 
10.0 

»»»8.pem(53) # 排 列 数 

60.0 

>> > S.gamma (4) #gama FR C 

6.0 

»»»S.beta(10, 200) #beta 函数 
2.839607777181333e- 18 

»»»8.sinc(0) sinc 函数 

1.0 


1323 信号 处 理 模 块 signal 


signal 模块 包含 大 量 滤波 函数 .B 样 条 插值 算法 等 。 下 面 的 代码 演示 了 一 维 信号 的 
卷 积 运 算 


>>> inport numpy as np 

»»»x-np.array([1, 2, 3]) 

»»»h-np.array([4, 5, 6]) 

>> > import scipy.signal 

>>> scipy.signal.convolve (x, h) # 一 维 卷 积 运算 
array([ 4, 13, 28, 27, 18]) 


下 面 的 代码 演示 了 二 维 图 像 卷 积 运算 ,运行 结果 如 图 13-1 所 示 。 
ámport numpy as np 

fram scipy import signal, misc 

import matplotlib.pyplot as plt 


Joey Python 可 以 这 样 学 


4 


image=misc.lena() # 二 维 图 像 数 组 ,lena 图 像 
w-np.zeros((50, 50)) $4 0 二 维 数组 , 卷 积 核 
w[0] [0]=1.0 # 修 改 参数 ,调整 滤波 器 
w[49] [25]- 1.0 # 可 以 根据 需要 调整 
image new= signal.fftconvolve (image, w) HEH FET 算 法 进行 卷 积 
plt.figure() 

plt.imshow(image new) # 显 示 滤 波 后 的 图 像 
plt.gray() 

plt.title('Filtered image") 

plt.show() 


Filtered image 


图 13-1 lena 图 像 处 理 结果 


下 面 的 代码 对 lena 图 像 进行 模糊 ,运行 结果 如 图 13-2 所 示 。 


image=misc.lenal() 
w- signal.gaussian(50, 10.0) 
image new signal.sepfir2d(image, w, w) 


中 值 滤波 是 数字 信号 处 理 、 数 字 图 像 处 理 中 常用 的 预 处 理 技术 ,特点 是 将 信号 中 每 个 


值 都 蔡 换 为 其 邻 域内 的 中 值 , 即 邻 域内 所 有 值 排序 后 中 间 位 置 上 的 值 。 下 面 的 代码 演示 
了 scipy 模块 的 中 值 滤波 算法 的 用 法 。 


>>> import randcm 

> > > import numpy as np 

>>> import scipy.signal as signal 
»»»x-np.arange (0, 100,10) 

>>> randm. shuffle (x) # 打 乱 顺 序 
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Filtered image 
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100 200 300 400 
图 13-2 lena 图 像 模糊 处 理 结果 


>>>x 

array([40, 0, 60, 20, 50, 70, 80, 90, 30, 10]) 

>>> signal.medfilt (x,3) # 中 值 滤波 
array([ O., 40.， 20., 50. 50., 70., 80., 80., 30., 10.]) 


1324 图 像 处 理 模 块 ndimege 


模块 ndimage 提供 了 大 量 用 于 N 维 图 像 处 理 的 方法 ,下 面 仅 选取 一 部 分 进行 演示 ， 
更 多 的 用 法 可 以 参考 官方 文档 。 


1. 图 像 滤波 

>>> frm scipy import misc 

>>> fram scipy import ndimage 

>>> inport matplotlib.pyplot as plt 

>>> face-misc.face() #face 是 测试 图 像 之 一 
»»»plt.figure() # 创 建 图 形 
»»»plt.imshow(face) # 绘 制 测试 图 像 
»»»plt.show() # 原 始 图 像 , 如 图 13- 3 所 示 
>>>blurred face-ndimage.gaussian filter(face，sigme= 7) 


# 高 斯 滤波 
>>>Plt.imshow (blurred face) 
>>>plt.show() # 高 斯 滤波 图 像 , 如 图 13- 4 所 示 
»»» blurred facel- ndimage.gaussian filter(face, sigma 1) 

# 以 下 3 行为 边缘 锐 化 
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»»»blurred face3-ndimage.gaussian filter(faoe, sigma- 3) 
>>> sharp face-blurred face3* 6* (blurred face3- blurred facel) 


»»»plt.imshow(sharp face) # 见 图 13-5 
»»»plt.show() 

»»»median face-ndimege.median filter(face, 7) # 中 值 滤波 
»»»plt.imshow(median face) ULIS 13-6 


»»»plt.show() 


- 600 


图 13-3 原始 图 像 


400 600 
图 13-4 高 斯 滤波 结果 
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400 600 


图 13-6 中 值 滤波 结果 


>>> square- np.zeros ( (32,32) ) # 全 0 数组 
>> > square[10:20, 10:20]- 1 # 把 其 中 一 部 分 设置 为 1 
»»»x y= G2* np.randm.randm((2, 15))) .astype (np.int) 

# 随 机 位 置 
»»»sqare[x, y]|- 1 # 把 随机 位 置 设置 为 1 
>>>Plt.imshow(square) # 原 始 随机 图 像 , 见 图 13-7 
»»»plt.show() 
»»»cpen square- ndimage.binary opening (square) # 开 运算 
»»»plt.imshow(open square) # 开 运算 结果 , 见 图 13-8 


»»»plt.show() 


400 
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>>> eroded sqnarer ndimege.binary erosion (square) 
>>>Plt.imshow(eroded square) 

>>>Plt.show() 

>> > closed square- ndimege.binary closing(square) 
>>>Plt.imshow(closed square) 


»»»plt.show() 


10 15 20 
图 13-7 原始 随机 图 像 


10 15 20 
图 13-9 膨胀 运算 结果 


3. 图 像 测 量 
>>> ndimage.measurements.maximm(face) 
255 


>>> ndimage.measurements.maximum position (face) 


# 膨 胀 运算 
# 膨 胀 运算 结 果 , 见 图 13-9 


w 


10 
图 13-8 开 运 算 结果 


15 20 25 30 


图 13-10 ” 闭 运算 结果 


# 最 大 值 


# 最 大 值 位 置 


(242, 560, 2) 

>>> ndimage.measurements .mean (face) 
110.16274388631184 

>>> ndimage.measurements median (face) 
109.0 

>>> ndimage.measurements.sum (face) 
259906521 

>>> ndimage.measurements variance (face) 
3307.17544034096 
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# 平 均值 


# 中 值 


>>>nqdimage.measurements.standard deviation (face) 


57.508046744268405 


»»»ndimage.measurements.histogram(face, 0, 255, 256) 


13.3 扩展 库 pandas 简介 


pandas(Python Data Analysis Library) 是 基于 numpy 的 数据 分 析 模 块 ,提供 了 大 量 
标准 数据 模型 和 高 效 操作 大 型 数据 集 所 需要 的 工具 ,可 以 说 pandas 是 使 得 Python 能 够 
成 为 高 效 且 强大 的 数据 分 析 环 境 的 重要 因素 之 一 。 

pandas 主要 提供 了 3 种 数据 结构 : Series, 带 标签 的 一 维 数组 ; @DataFrame, 带 标 
签 且 大 小 可 变 的 二 维 表格 结构 ; 加 Panel, 带 标签 且 大 小 可 变 的 三 维 数组 。 


可 以 在 命令 提示 符 环 境 使 用 pip 工具 下 载 和 安装 pandas, 然 后 按照 Python 社区 的 习 
惯 ,使 用 下 面 的 语句 导入 : 

»»»import pandas as pd 

1. 生成 一 维 数组 


>>> inport numpy as np 
»»»x-pd.Series([1, 3, 5, np.nan]) 


2. 生成 二 维 数组 


>>> dates= pd.date rang (start= '20130101', end= 


>>> dates=pd.date range (start= '20130101', end- 


'20131231', freq- 'D') 
# 间 隔 为 天 

'20131231', freq- 'M') 
# 间 隔 为 月 


>> > df- pd.DataFrame (np.randam.randn (12,4), index= dates, colums- list('ABCD')) 


>>> df= pd. DataFrame ( [ [np. random. randint (1,100) for j in range (4)] for i in range (12)], index- dates, 


colums- list('ABCD!)) 


#4 列 随机 数 


>>> dE pd.DataFrame (('A' : [np.randcm.randint (1,100) for i in range (4) ], 
"B':pd.date range(start— '20130101', periods-4, freg 'D'), 
"C'spi.Series([1, 2, 3, 4],indes- list (range (4)),dtype— "float32"), 
"D'smp.armay([3] * 4,dtype- "int32"), 
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"E" :pd.Categorical ( ["test", "train", "test", "train"]) , 


"E':'foo']) 


>>> d£- pd.DataFrame (('A' : [np.randm.randint (1,100) for i in range 4) ], 
'B'spd.date range (start= '20130101', periods-4, freg- 'D'), 
'C' spd.Series([1, 2, 3, 4], index- ['zhang', 'li', 'zhou', 'wang'],dtype- 'float32'), 


'D'snp.array([3] * 4,dtype- 'int32'), 


'E' :pd.Categorical (["test", "train", "test", "train"]) , 


"F':'foo']) 

3. 二 维 数据 查看 

>>> df.head() # 默 认 显示 前 5 行 
>>> df.head(3) # 查 看 前 3 行 
>>>df.tail (2) # 查 看 最 后 2 行 


4. 查看 二 维 数据 的 索引 、 列 名 和 数据 


>>> df.index 
>>> df.colums 
>>> df.values 


5 查看 数据 的 统计 信息 


>>> df.describe() 


# 返 回 平均 值 ,标准 差 ,最 小 值 . 最 大 值 等 信息 


6. 二 维 数据 转 置 

»»»df.T 

7. 排序 

»»»df.sort index(axis-0, ascending- False) # 对 轴 进 行 排序 

>>> df.sort_ index(axis-l, ascending- False) 

»»»df.sort values (by= 'A') # 对 数据 进行 排序 

>> > df.sort values (by- 'A', ascending- False) # 降 序 排列 

8. 数据 选择 

»»»df['A'] # 选 择 列 

»»»df[0:2] # 使 用 切片 选择 多 行 
»»»df.loc[:, ['A', 'C']] # 选 择 多 列 
»»»df.loc[['zhang', 'zhou'], ['A', 'D', 'E']] # 同 时 指定 多 行 与 多 列 进行 选择 
»»»df.loc['zhang', ['A', 'D', 'E']] 

»»»df.at['zhang', 'A'] # 查 询 指定 行列 位 置 的 数据 值 


»»2»df.at['zbang', 'D'] 
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>>>df.iloc[3] # 查 询 第 3 行 数据 
»»»df.iloc[0:3, 0:4] # 查 询 前 3 行 . 前 4 列 数据 
»»»df.iloc[[0, 2, 3], [0, 4]] # 查 询 指定 的 多 行 、 多 列 数据 
»»»df.iloc[0,1] # 查 询 指定 行列 位 置 的 数据 值 
>>> df.iloc[2,2 
»»» df[df.2» 50] # 按 给 定 条 件 进行 查询 
9 数据 修改 与 设置 
»»»df.iat[0, 2]-3 # 修 改 指定 行列 位 置 的 数据 值 
>>> df.loc[:，'D']= [np.randam.randint (50, 60)for i in range(4)] 

# 修 改 某 列 的 值 
»»»df['c']-- df('c'] # 对 指定 列 数据 取 反 


10. 缺失 值 处 理 ( 缺 失 值 和 异常 值 处 理 是 大 数据 预 处 理 环节 中 很 重要 的 一 个 步骤 ) 


>>> dfl= df.reingdex (index= ['zhang', 'li', 'zhou', 'wang'], colums- list (df.colums)+ ['G']) 


»»»dfl.iat[0, 6]=3 # 修 改 指定 位 置 的 元 素 值 ,该 列 其 他 元 素 为 缺失 值 NN 
>>>pd.isnull (dfl) # 测 试 缺失 值 , 返 回 值 为 rrue/False 阵 列 

>>> dfl.dropna() # 返 回 不 包含 缺失 值 的 行 
»»»dfl['G'].fillna(5, inplace- True) # 使 用 指定 值 填 充 缺 失 值 

11. 数据 操作 

>>> dfl.mean() # 平 均值 ,自动 忽略 缺失 值 

»»»df.mean(1) # 横 向 计算 平均 值 

»»»dfl.shift(1) # 数 据 移 位 

»»»dfl['D'].value counts() # 直 方 图 统计 

>> > df2- pd.DataFrame (rp.randem.randn (10, 4)) 

»»»pl-df2[:3] # 数 据 行 拆 分 

>>>P2- df2[3:7] 

»»»p3-df2[7:] 

>> > df3- pd.concat ([pl, p2, p3]) # 数 据 行 合 并 

>>>df2 ==df3 # 测 试 两 个 二 维 数据 是 否 相 等 ,返回 True/False 阵 列 


>>> df4 pd.DataFrarme (('A' : [np.randam.randint (1,5) for i in range (8)], 
"B': [np.randam. randint (10,15) for i in range (8)], 
"C": [np.randam. randint (20, 30) for i in range (8)], 
'D' : [np.randam. randint (80,100) for i in range (8) ])) 
>>>df4.groupby ('A') .sum() # 数 据 分 组 计算 
>>> df4.grourby (['A', 'B']) -mean () 


12. 结合 matplotlib 绘图 


>>> inport pandas as pd 
>>> import numpy as np 
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>>> inport matplotlib.pyplot as plt 
>> > df- pd.Datagrame (np.randam.randn (1000, 2), colums- ['B', 'C']) .cumsun() 
2» »df['A']- pd.Series (list (range (len (df) ) )) 

»»»plt.figure() 

»» » df.plot (= 'A') 

»»»plt.show() 


代码 运行 结果 如 图 13-11 所 示 。 
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200 400 600 800 
图 13-11 绘制 曲线 图 结果 
下 面 的 代码 用 来 绘制 柱状 图 ,结果 如 图 13-12 所 示 。 


>>> df-pd.DataFrame (np.randam.rand(10, 4), columns- ['a', 'b', 'c', 'd']) 
>>>df.plot (kind- 'bar') 
»»»plt.show() 


将 上 面 代码 中 的 绘图 语句 改 为 
>>> df.plot (kind- 'barh', stacked- True) 
运行 结果 如 图 13-13 所 示 。 

13. 文件 读 写 


»»»df5.to excl ('d:\\test.xlsx', sheet meme- 'dfg') PERRA Excel 文 件 
>>> dfG- pd.reed. excel ('d:\\test.xlsx', 'dfg', index col-None, na values- ["NA']) 
»»»df6.to csv('d:NNtest.csv!) # 将 数据 保存 为 csv 文 件 
>>> d£7- pd.read csv('d:\\test.csv') HER csv 文 件 中 的 数据 


13.4 统计 分 析 标 准 库 statistics 用 法 简介 


Python 标准 库 statistics 提供 了 大 量 方法 用 于 计算 数值 数据 的 数理 统计 信息 。 
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13342 绘制 柱状 图 结果 


anow 
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图 13-13 水 平 柱状 图 绘制 结果 


1. 计算 平均 数 函 数 mean() 


>>> import statistics 

»»»statistics.mean([1, 2, 3, 4, 5, 6, 7, 8, 9]) 
5.0 

>>> statistics.mean (range (1, 10) ) 

5.0 

>>> import fractions 

»»»x-[G, 7), (L, 21), (5, 3, 0, 31 

»»»y- [fractions.Fraction(* item)for item in x] 
>>>y 


# 使 用 包含 整数 的 列表 做 参数 


# 使 用 range 对 象 做 参数 


# 创 建 包含 分 数 的 列表 
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[Fraction(3, 7), Fraction(l, 21), Fraction(5, 3), Fraction(1, 3)] 

>>> statistics.mean (y) # 使 用 包含 分 数 的 列表 做 参数 
Fraction (13, 21) 

>>> import decimal 

>>>x= ('0.5', '0.75', '0.625', '0.375') 

»»» y-map(decimal.Decimal, x) 

>>> statistics.mean (y) 

Decimal ("0.5625") 


2. 中 位 数 函 数 median O , median lowO , median highO , median grouped (O 


>>> statistics.median([1, 3, 5, 7]) # 偶 数 个 样本 时 取 中 间 两 个 数 的 平均 数 
4.0 

»»»statistics.median low([1, 3, 5, 7]) ”# 偶 数 个 样本 时 取 中 间 两 个 数 的 较 小 者 
3 

»»»statistics.median high([1, 3, 5, 7]) # 偶 数 个 样本 时 取 中 间 两 个 数 的 较 大 者 
5 

>> > statistics.median (range (1,10) ) 

5 

>> > statistics.median low([5, 3, 7]), statistics.median high([5, 3, 7]) 

(5, 5) 

»»»statistics.median grouped([5, 3, 7]) 

5.0 

»»»statistics.median grouped([52, 52, 53, 54]) 

52.5 

»»»statistics.median grouped([1, 3, 3, 5, 7]) 

3.25 

»»»statistics.median grouped([1, 2, 2, 3, 4, 4, 4, 4, 4, 5]) 

3d 

»»»statistics.median grouped([1l, 2, 2, 3, 4, 4, 4, 4, 4, 5], interval-2) 

3.4 


3. 返回 最 常见 数据 或 出 现 次 数 最 多 的 数据 的 函数 mode() 


>>> statistics.mde([1, 3, 5, 7]) # 无 法 确定 出 现 次 数 最 多 的 唯一 元 素 
statistics.StatisticsError: no unique mode; found 4 equally ommon values 
»»»statistics.mode([1, 3, 5, 7, 3]) 

3 

»»»statistics.mode(["red", "blue", "blue", "red", "green", "red", "red"]) 

"reg! 


4. pstdev() 


返回 总 体 标准 差 。 


>>> statistics.pstdev ([1.5, 2.5, 2.5, 2.75, 3.25, 4.75]) 
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0.986893273527251 


>>> statistics.pstdev (range (20) ) 
5.766281297335398 


5. pvariance() 
返回 总 体 方差 或 二 次 矩 。 


»»»statistics.pvariance([1.5, 2.5, 2.5, 2.75, 3.25, 4.75]) 
0.9739583333333334 

>>> [L, 2, 3, 4, 5, 10, 9, 8, 7, 6] 

»»»mr statistics.mean (x) 

»»»m 

5.5 

»»»Statistics.pvariance([1, 2, 3, 4, 5, 10, 9, 8, 7, 6], m) 
8.25 

»»»statistics.pvariance (range (20) ) 

33.25 

»»»statistics.pvariance ( (randcm. randint (1, 10000) for i in range (30))) 
10903549.933333334 


6. variance ,stdev() 


计算 样本 方差 和 样本 标准 差 也 称 为 均 方差 。 


>>> statistics.varianoe (range (20) ) 

35.0 

>>> statistics.stdev (range (20) ) 

5.916079783099616 

»»» * 

35.0 

»»»statistics.variance([3, 3, 3, 3, 3, 3]), statistics.stdev([3, 3, 3, 3, 3, 3]) 
(0.0, 0.0) 


13.5 matplotlib 


matplotlib 模块 依赖 于 numpy 模块 和 tkinter 模块 ,可 以 绘制 多 种 形式 的 图 形 , 包 括 
线 图 、 直 方 图 、 饼 状 图 、 散 点 图 \ 误 差 线 图 等 ,图 形 质 量 可 满足 出 版 要 求 ,是 计算 结果 可 视 化 
的 重要 工具 。 


1351 绘制 正弦 曲线 


inport numby as np 
inport pylab as pl 
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t-np.arange (0.0, 2.0* np.pi, 0.01) # 生 成 数组 ,0~ 2x 之 间 , 以 0.01 为 步 长 
s-np.sin(t) # 对 数组 中 的 所 有 元 素 求 正弦 值 ,得 到 新 数组 
pl.plot (t,s) # 画 图 ,以 t 为 横 坐 标 ,s 为 纵 坐标 
pl.xlabel ('x') # 设 置 坐标 轴 标 签 
pl.ylabel('y') 
pl.title('sin') # 设 置 图 形 标题 
pl.show() # 显 示 图 形 


运行 结果 如 图 13-14 所 示 。 


sin 


10 
0.5 
> 00 
-0.5 
-1.0 
1 2 3 4 5 6 7 
Xx 
图 13-14 正弦 曲线 


1352 绘制 散 点 
下 面 的 代码 绘制 了 余弦 曲线 的 散 点 图 ,运行 结果 如 图 13-15 所 示 o 


import numpy as np 
inport pylab as pl 


ee np.arange (0, 2.0* np.pi, 0.1) 
b- rp.oos (a) 

pl.scatter (a,b) # 绘 制 散 点 图 
pl.show() 


散 点 图 是 分 析 数据 相关 性 常用 的 方法 ,下 面 的 代码 使 用 随机 数 生成 数值 然后 生成 散 
点 图 ,并 根据 数值 大 小 来 计算 散 点 的 大 小 ,运行 结果 如 图 13-16 所 示 。 


import matplotlib.pylab as pl 
ámport numpy as np 
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图 13-15 余弦 散 点 图 
x= np. rand. random (100) 
y= np. random. random (100) 
pl.scatter (x, y, s- x * 500,c- u'r' marker- u' * ') #s 指 大 小 ,c 指 颜色 ,marker 指 符号 形状 
pl.show() 
12 
10 DE kx Sek. 
08 a *x* »* * 
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* * c ak * 
ex RS k 
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DO ZU 
0.0 * w k 
-0.2 
702 0.0 02 04 0.6 0.8 10 12 
图 13-16 散 点 图 


1353 绘制 饼 状 图 


import numpy as np 
import matplotlib.pyplot as plt 
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#The slices will be ordered and plotted counter- clockwise. 

sizes- [15, 30, 45, 10] 

colors- ['yellowgreen', 'gold', '#FF0000', 'lightcoral'] 

explode — (0, 0.1, 0, 0.1) # 使 饼 状 图 中 第 2 片 和 第 4 片 裂 开 


fig-plt.figure() 

ax- fig.gca () 

ax.pie (np.randcm.randam(4), explode- explode, labels- labels, colors- colors, 
autopct- '$1.1f$$', shadow- True, startangle- 90, 
radius- 0.25, center- (0, 0), frame= True) 

ax.pie(np.random.random(4), explode- explode, labels- labels, colors- colors, 
autopct= '$1.1f$$', shadow- True, startangle- 90, 
radius- 0.25, center- (1, 1), frame- True) 

ax.pie (np.random.randem(4), explode- explode, labels- labels, colors- colors, 
autopct- '$1.1f$$', shadow- True, startangle- 90, 
radius- 0.25, center- (0, 1), frame- True) 

ax.pie (np.random.random(4), explode- explode, labels- labels, colors- colors, 
autopct- '$1.1f$$', shadow- True, startangle- 90, 
radius- 0.25, œnter= (1, 0), frame- True) 

ax.set xticks([0, 1]) # 设 置 坐标 轴 刻 度 

ax.set yticks([O, 1]) 

ax.set xticklabels(["Sunny", "Cloudy"]) ”# 设 置 坐 标 轴 刻 度 上 显示 的 标签 

ax.set yticklabels(["Dry", "Rainy"]) 

ax.set xlim((- 0.5, 1.5)) # 设 置 坐标 轴 跨 度 

ax.set ylim((- 0.5, 1.5)) 

#Set aspect ratio to be equal so that pie is drawn as a circle. 

ax.set aspect ('equal') 


plt.show() 
程序 运行 结果 如 图 13-17 所 示 。 
1354 绘制 带 有 中 文 标签 和 图 例 的 图 


import numpy as np 
inport pylab as pl 
import matplotlib.font manager as fm 


myfont= fm.FontProperties (fname- r'C: Windows VFontsVSTKATTI .ttf') 


# 设 置 字体 
t-np.arange (0.0, 2.0* np.pi, 0.01) # 自 变量 取 值 范围 
s mp.sin(t) Lug EZAMA 


z-np.cos (t) # 计 算 余 弦 函 数值 
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Rainy 


Logs Dogs 


Sunny Cloudy 
图 13-17 绘制 饼 状 图 


pl.plot(t, s, label= 'E 3% ") 
pl.plot(t, z, label= .余弦 由 
pl.xlabel('x- Elit ', fontproperties- 'STKAITI', fontsize- 24) 

HET x 标签 
pl.ylabel ('y- 正弦 余弦 函数 值 ',， fontproperties= 'SIKAITI', fontsize- 24) 
pl.title('sin- cos 函数 图 像 '，fontproperties= 'SIKATTI', fontsize- 32) 


# 图 形 标题 
pl.legend (prop=myfont) # 设 置 图 例 
pl.show() 
运行 结果 如 图 13-18 所 示 o 

sin-cos 函 数 图 像 


10 


0.5 
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J 正 弦 余 弦 函 数值 


图 13-18 中文 标 签 和 图 例 
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1355 绘制 图 例 标签 中 带 有 公式 的 图 


import numpy as np 
import matplotlib.pyplot as plt 


x-rnp.linspace(0, 2* rp.pi, 500) 

y-mp.sin(x) 

z-rp.cos(x* x) 

plt.figure(figsize- (8,5)) 

Sg A RJ S ES FLA EO. Iamex 引 擎 将 其 显示 为 公式 
plt.plot (x, y, label= '$ sin (x)$ ',color- 'red' ,linewidth- 2) # 红 色 ,2 个 像素 宽 
plt.plot (x, z, 'b- - ',label- '$ cos (x^2)$ ') # 蓝 色 ,虚线 
plt.xlabel ("Time (s) ') 

plt.ylabel ('Volt') 

plt.title('Sin and Cos figure using pyplot") 

plt.ylim(- 1.2,1.2) 

plt.legend() # 显 示 图 例 
plt.show() 


运行 结果 如 图 13-19 所 示 。 


Sin and Cos figure using pyplot 


13-19 标签 中 带 公 式 的 图 


1356 使 用 pod 绘制 ,多 个 图 形 单独 显示 


inport numpy as np 

import matplotlib.pyplot as plt 

x-rnp.linspace(0, 2* np.pi, 500) # 创 建 自 变量 数组 
yl=rp.sin (x) # 创 建 函 数值 数组 
y2- np.cos (x) 


y3-np.sin(x* x) 
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plt.figure(1) # 创 建 图 形 
#create three axes 
axi-plt.subplot (2,2,1) # 第 一 行 第 一 列 图 形 
ax2- plt.subplot (2,2,2) # 第 一 行 第 二 列 图 形 
ax3=plt.subplot (2,1,2) # 第 二 行 
plt.sca(axl) # 选 择 axl 
plt.plot (x, yl, color- 'red') # 绘 制 红色 曲线 
plt.ylim(- 1.2,1.2) # 限 制 Y 坐 标 轴 范 围 
Plt.sca (ax2) HER ax2 
plt.plot (x, 2, 'b- - ') # 绘 制 蓝 色 曲线 
plt.ylim(- 1.2,1.2) 
plt.sca (ax3) # 选 择 ax3 
plt.plot (x, y3, 'g- - ') 
plt.ylim(- 1.2,1.2) 
plt.show() 
运行 结果 如 图 13-20 所 示 。 
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图 13-20 多 图 形 同 时 显示 
1357 绘制 三 维 参数 曲线 
import matplotlib as mpl 
fram mpl toolkits.mplot3d import Axes3D 
inport numpy as np 
import matplotlib.pyplot as plt 
mpl.rcParams['legend.fontsize']- 10 # 图 例 字号 
fig=plt.figure() 
ax- fig.gca (projection- '3d') # 三 维 图 形 
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theta-np.linspace(- 4 * np.pi, 4 * np.pi, 100) 
z-np.linspace (- 4, 4, 100) * 0.3 # 测 试 数据 
rm ž**3+1 

x-r * np.sin(theta) 

y-r * mp.cos(theta) 

ax.plot(x, y, z, label- 'parametric curve') 


程序 运行 结果 如 图 13-21 所 示 。 


图 13-21 绘制 三 维 参数 曲线 


1358 绘制 三 维 图 形 


inport numpy as np 
import matplotlib.pyplot as plt 
import mpl toolkits.mplot3d 


x,y-np.mgrid[- 2:2:20j, - 2:2:203] 

z-50 * np.sin(xty) # 测 试 数据 
ax-plt.subplot (111, projection- '3d') # 三 维 图 形 
ax.plot _surface (x,y,z, rstrid=2, cstride=1, amp=plt.an.Blues r) 
ax.set_xlabel ('X') # 设 置 坐标 轴 标 签 


ax.set ylabel('Y') 
ax.set zlabel('Z') 

plt.show() 

运行 结果 如 图 13-22 所 示 ,在 绘图 窗口 中 可 用 鼠标 来 旋转 绘制 图 形 。 

下 面 的 代码 绘制 了 另 一 个 略 加 复杂 的 三 维 图 形 ,运行 结果 如 图 13-23 Bros 。 


inport pylab as pl 
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图 13-22 绘制 三 维 图 形 ( 一 ) 


import numpy as np 
import mpl toolkits.mplot3d 


rho, theta- np.mgrid[0:1:40j, 0:2* np.pi:40j] 
z-rho**2 

x= rho* np.cos (theta) 

y-rho* np.sin(theta) 

ax-pl.subplot (111, projection- '3d') 
ax.plot surface (x,y, Z) 


pl.show() 


图 13-23 绘制 三 维 图 形 ( 二 ) 
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1359 使 用 指令 绘制 自 定义 图 形 


下 面 的 代码 使 用 matplotlib.path 的 Path 对 象 根据 设 定 的 指令 和 坐标 绘制 任意 图 形 ， 
绘图 结果 如 图 13-24 所 示 。 


fram matplotlib.path import Path 
fran matplotlib.patches import PathPatch 
inport matplotlib.pyplot as plt 


fig, ax- plt.subplots () 


# 定 义 绘 图 指令 与 控制 点 坐标 
# 其 中 ,METD 表 示 将 绘制 起 点 移 到 指定 坐标 
#CUFVE4 表 示 使 用 4 个 控制 点 绘制 3 次 贝 塞 尔 曲线 
#CURVE3 表 示 使 用 3 个 控制 点 绘制 ?次 贝 塞 尔 曲线 
#LINETO 表 示 从 当前 位 置 绘 制 直线 到 指定 位 置 
#CLOSEFOLY 表 示 从 当前 位 置 绘制 直线 到 指定 位 置 , 并 闭合 多 边 形 
path data- [ 
(Path.MVETO, (1.58, - 2.57)), 
(Path.CURVEA, (0.35, - 1.1)), 
(Path.CURVEA, (- 1.75, 2.0)), 
(Path.CURVEA, (0.375, 2.0)), 
(Path.LINETO, (0.85, 1.15)), 
(Path.CURVEA, (2.2, 3.2)), 
(Path.CURVEA, (3, 0.05)), 
(Path.CURVEA, (2.0, - 0.5)), 
(Path.CURVE3, (3.5, - 1.8)), 
(Path.CURVE3, (2, - 2)), 
(Path.CIOSEFOLY, (1.58, - 2.57)), 
] 
codes, verts- zip(* path data) 
path= Path (verts, codes) 
# 按 指令 和 坐标 进行 绘图 
patch- FathPatch (path，facecolor= 'r', alpha- 0.9) 
ax.add patch (patch) 


# 绘 制 控制 多 边 形 和 连接 点 
X, y- zip(* path.vertices) 
line,-ax.plot(x, y, 'go- ') 


# 显 示 网 格 
ax.grid() 
# 设 置 坐标 轴 刻 度 大 小 一 致 ,可 以 更 真实 地 显示 图 形 
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ax.axis('equal') 
plt.show() 


= 0 2 4 


图 13-24 使 用 指令 绘制 任意 图 形 


13510 在 tknter 中 使 用 matplatlib 


强大 的 matplotlib 不 仅 提供 了 显示 图 形 的 窗口 ,还 支持 把 绘制 的 结果 代入 Python 的 
tkinter 程序 界面 中 。 下 面 的 代码 把 matplotlib ARRERA tkinter 程序 中 ,运行 结果 
如 图 13-25 所 示 , 关 于 tkinter 的 内 容 请 参考 第 15 章 。 


inport sys 

import tkinter as Tk 

import matplotlib 

from numpy import arange, sin, pi 

fram matplotlib.backends.backend tkagg import FigureCanvasTk!gg 

fram matplotlib.backends.backend tkagg import NavigationToolbar2TkAgg 
frammatplotlib.backend bases import key press handler 


fram matplotlib.figure import Figure 
matplotlib.use ("TkAgg*) 


root= Tk.Tk () 
root.title("matplotlib in TK") 

# 设 置 图 形 尺寸 与 质量 
f-Figure(figsize- (5, 4), dpi= 100) 
a-f.adà subplot (111) 
t=aranæ(0.0, 3, 0.01) 


s-sin(2* pi* t) 
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# 绘 制图 形 
a.plot(t, s) 


# 把 绘制 的 图 形 显示 到 tkinter 窗 口上 

canvas- FigureCanvasTkAgg (f, master- root) 

canvas.show () 

canvas.get tk widget().pack(side- Tk.TOP, fill- Tk.BOTH, expand 1) 
HE matplotlib 绘 制图 形 的 导航 工具 栏 显 示 到 tkinter 窗 口上 
toolbar= NavigationToolbar2TkAgg (canvas, root) 

toolbar update () 

canvas. tkcanvas.pack(side- Tk.TOP, fill- Tk.BOTH, expand- 1) 


# 定 义 并 绑 定 键盘 事件 处 理 函 数 
def on key event (event) : 

print ('you pressed $s' Sevent.key) 

key press handler (event, canvas, toolbar) 
canvas.mpl connect('key press event', on key event) 


# 按 钮 单 击 事件 处 理 函 数 
def quit(: 
# 结 束 事件 主 循环 ,并 销毁 应 用 程序 窗口 
root.quit() 
root.destroy() 
button- Tk.Button(master- root, text= 'Quit', ocmmand- quit) 
button.pack (side= Tk.BOTIOM) 


Tk.mainloop() 


ielolo-siem 
[B 13-25 把 matplotlib £t IAE RA, tkinter 程序 中 
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13511 使 用 matplotlib 提 供 的 组 件 实现 交互 式 图 形 显示 


工具 箱 matplotlib 除了 丰富 的 绘图 功能 ,还 提供 了 单 选 按钮 、 复 选 框 ,按钮 等 一 系列 
组 件 , 可 以 实现 更 加 强大 的 图 形 交互 式 显示 功能 。 下 面 的 代码 运行 后 ,可 以 通过 左 侧 的 三 
组 单 选 按钮 来 设置 正弦 曲线 的 频率 、 颜 色 和 线 型 ,并 根据 新 的 设置 来 绘制 正弦 曲线 ,每 次 
单 击 图 形 下 方 的 按钮 ,由 系统 随机 设置 频率 、 颜 色 和 线 型 并 绘制 新 图 形 ,同时 根据 随机 选 
择 的 值 来 设置 三 组 单 选 按钮 的 选中 项 。 和 运行 结果 如 图 13-26 所 示 。 


fram randcm import choice 

import numpy as np 

import matplotlib.pyplot as plt 

fram matplotlib.widgets import RadicButtons, Button 


t^ np.arange (0.0, 2.0, 0.01) 
s0- np.sin(2* np.pi * t) 
Sl-np.sin(4* np.pi* t) 
s2- np.sin(8* np.pi* t) 


fig, ax-plt.subplots() 
l,-ax.plot(t, s0, lw=2, color= 'red') 
plt.subplots adjust (left- 0.3) 


# 定 义 允 许 的 几 种 频率 ,并 创建 单 选 按钮 组 件 
# 其 中 , (0.05, 0.7, 0.15, 0.15] 表 示 组 件 在 窗口 上 的 归 一 化 位 置 和 大 小 
axcolor- 'lightgoldenrodyellow* 
rax- plt.axes([0.05, 0.7, 0.15, 0.15], axisbg- axcolor) 
radio- RadicButtons (rax, ('2 Hz', '4 Hz', '8 Hz')) 
hzdict- ('2 Hz': s0, '4 Hz': sl, '8 Hz': s2} 
def hzfunc (label) : 

ydata- hzdict [label] 

l.set ydata(ydata) 

plt.draw() 
radio.on clicked(hzfunc) 


# 定 义 允 许 的 几 种 颜色 ,并 创建 单 选 按钮 组 件 
xax-plt.axes([0.05, 0.4, 0.15, 0.15], axisbg- axcolor) 
colors = ('red', "blue', 'green') 
radic2- RadicButtons (rax, colors) 
def colorfunc (label) : 

l.set color (label) 

plt.draw() 
radic2.on clicked(colorfunc) 


# 定 义 允 许 的 几 种 线 型 ,并 创建 单 选 按钮 组 件 
rax-plt.axes([0.05, 0.1, 0.15, 0.15], axisbg- axcolor) 
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styles = ('- !, '-- ', '- .', 'steps', ':") 
radio3= RadicButtons (rex, styles) 
def stylefunc (label) : 
l.set linestyle (label) 
plt.draw() 
radio3.on clicked(stylefunc) 


# 定 义 按钮 单 击 事件 处 理 函 数 ,并 在 窗口 上 创建 按钮 
def randamFig (event) : 
# 随 机 选择 一 个 频率 ,同时 设置 单 选 按钮 的 选中 项 
hz- choice (tuple (hzdict..keys ()) ) 
hzlabels- [label.get text()for label in radio.labels] 
radio.set active (hzLabels.index (hz) ) 
l.set ydata(hzdict[hz]) 
# 随 机 选择 一 个 颜色 ,同时 设置 单 选 按钮 的 选中 项 
c7 choice (colors) 
radic2.set active (colors.index(c)) 
l.set color(c) 
# 随 机 选择 一 个 线 型 ,同时 设置 单 选 按钮 的 选中 项 
style- choice (styles) 
radic3.set active (styles.index(style)) 
l.set linestyle (style) 
# 根 据 设 置 的 属性 绘制 图 形 
plt.draw() 
axRnd- plt.axes([0.5, 0.015, 0.2, 0.045]) 
buttonRnd- Button (axRnd, 'Randem Figure') 
buttonRnd.on clicked (randamFig) 
# 显 示 图 形 
plt.show() 


ejm x yj 


[alololt le —— 
13-26 matplotlib 组 件 的 应 用 
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18512 根据 实时 数据 动态 更 新 图 形 


在 开发 与 数据 监测 和 数据 可 视 化 有 关 的 系统 时 ,我 们 需要 根据 最 新 的 数据 对 图 形 进 
行 更 新 。 下 面 的 代码 模拟 了 这 种 情况 , 单 击 Start 按钮 时 会 更 新 数据 并 重新 绘制 图 形 使 
得 曲线 看 上 去 在 移动 一 样 , 单 击 Stop 按钮 则 停止 更 新 数据 ,运行 结果 如 图 13-27 所 示 。 
代码 中 用 到 了 多 线程 编程 技术 ,请 参考 第 10 章 内 容 。 


fram time import sleep 
fram threading import Thread 

import numpy as np 

import matplotlib.pyplot as plt 

fram matplotlib.widgets import Button 


fig, ax- plt.subplots () 
# 设 置 图 形 的 显示 位 置 
plt.subplots adjust (bottam= 0.2) 
# 实 验 数据 
range start, range end, range step- 0, 1, 0.005 
t-np.arange(range start, range end, range step) 
s-np.sin(4* np.pi * t) 
l,-plt.plot(t, s, 1w- 2) 
# 自 定义 类 ,用 来 封装 两 个 按钮 的 单 击 事件 处 理 函 数 
class ButtonHandler: 
def init (self): 
self.flag- True 
self.range s, self.range e, self.range step- 0, 1, 0.005 
# 线 程 函 数 ,用 来 更 新 数据 并 重新 绘制 图 形 
def threadStart (self): 
while self.flag: 
sleep (0.02) 
self.range s *-self.range step 
self.range e *-self.range step 
t-np.arange(self.range s, self.range e, self.range step) 
ydata- np.sin(4* np.pi* t) 
# 更 新 数据 
l.set xdata(t- t[0]) 
l.set ydata(ydata) 
# 重 新 绘制 图 形 
plt.draw() 
def Start(self, event): 
self.flag- True 
# 创 建 并 启动 新 线程 
t- Thread (target= self.threadStart) 
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t.start() 
def Stop(self, event): 
self.flag- False 


callback- ButtonHandler () 

# 创 建 按钮 并 设置 单 击 事件 处 理 函 数 
axprev- plt.axes([0.81, 0.05, 0.1, 0.075]) 
bprev= Button (axprev, 'Stop') 

bprev.on clicked(callback.Stop) 
axnext- plt.axes([0.7, 0.05, 0.1, 0.075]) 
bnext-Button(axnext, 'Start') 

bnext.on clicked(callback.Start) 


plt.show() 


olol+ 
13-27 根据 最 新 数据 动态 更 新 图 形 


13513 使 用 Sider 组 件 调整 曲线 参数 


在 进行 数据 可 视 化 时 ,经 常 需要 调整 一 些 参数 ,前面 13. 5. 11 节 中 通过 三 组 单 选 按钮 
实现 了 曲线 的 频率 .颜色 和 线 型 的 实时 调整 ,下 面 的 代码 使 用 matplotlib 库 提供 的 Slider 
组 件 实现 正弦 曲线 振幅 和 频率 的 调整 , 比 使 用 单 选 按钮 更 加 灵活 。 和 运行 结果 如 图 13-28 
所 示 ,当然 , 也 可 以 在 此 基础 上 增加 用 来 调整 曲线 颜色 三 分 量 的 Slider 组 件 ,大 家 不 妨 尝 
ik— F. 

inport numpy as np 

inport matplotlib.pyplot as plt 
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fig, ax-plt.subplots () 

# 设 置 图 形 的 区 域 位 置 

plt.subplots adjust(left- 0.1, bottam= 0.25) 
t-np.arange (0.0, 1.0, 0.001) 

# 初 始 振幅 与 频率 ,并 绘制 初始 图 形 

a0, £0-5, 3 

s=a0* np.sin(2* np.pi* f0* t) 
1,-plt.plot(t, s, 1w-2, color- 'red') 

# 设 置 坐标 轴 刻 度 范围 

plt.axis([0, 1, —10, 10]) 


axColor- 'lightgoldenrodyellow" 
# 创 建 两 个 slider 组 件 , 分 别 设置 位 置 /尺寸 .背景 色 和 初始 值 
axfreq-plt.axes([0.1, 0.1, 0.75, 0.03], axisbg- axColor) 
sfreq-Slider(axfreg, 'Freq', 0.1, 30.0, valinit- f0) 
axamp- plt.axes([0.1, 0.15, 0.75, 0.03], axisbg- axColor) 
sap- Slider (axanp, 'Arp', 0.1, 10.0, valinit- a0) 
# 为 sliger 组 件 设置 事件 处 理 函 数 
def update (event) : 
# 获 取 slider 组 件 的 当前 值 ,并 以 此 来 更 新 图 形 
amp- samp.val 
freq- sfreq.val 
l.set ydata(amp* np.sin(2* np.pi* freq* t)) 
plt.draw() 
#fig.canvas.draw idle() 
sfreq.on changed (update) 
semp.on changed(update) 


# 创 建 djust 按钮 ,设置 大 小 ,位 置 和 事件 处 理 函 数 
def adjustSliderValue (event) : 
ampValue- samp.val* 0.05 
if ampValue» 10: 
ampValue- 0.1 
samp.set val(ampValue) 


fredValue- sfreq.val 0.05 
if frecValue» 30: 
fregValue- 0.1 

sfreq.set val(frecValue) 

update (event) 
axMdijust-plt.axes([0.6, 0.025, 0.1, 0.04]) 
buttonhdjust-Button(axAdjust, 'Adjust', color-axColor, hovercolor- 'red') 
buttonhdjust.on clicked(adjustSliderValue) 


424 é Python 可 以 这 样 学 
P d 


# 创 建 按钮 组 件 , 用 来 恢复 初始 值 
resetax- plt.axes ([0.8, 0.025, 0.1, 0.04]) 
button-Button(resetax, 'Reset', color= axColor, hovercolor- 'yellow') 
df reset (event) : 
sfreq.reset () 
samp.reset() 
button.on clicked(reset) 


plt.show() 


vm 
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图 13-28 使 用 Slider 组 件 调整 曲线 参数 


信息 加 密 和 信息 隐藏 是 实现 信息 安全 与 保密 的 主要 手段 。 从 古 到 今 人 类 发 明了 大 量 
的 加 密 算法 和 隐藏 信息 的 方法 。 例 如 ,把 纸 条 螺旋 缠绕 在 一 根木 棍 上 然后 往 上 写字 ,展开 
后 通过 一 定 的 渠道 把 纸 条 传递 给 对 方 ,对 方 把 纸 条 螺旋 缠绕 到 同样 粗细 的 木 棍 上 就 可 以 
正常 阅读 信息 ,其 他 人 即使 知道 这 样 的 方法 ,如 果 不 知道 木 棍 的 直径 也 无 法 解密 信息 ,可 
以 说 木 棍 的 直径 是 这 种 加 密 方法 中 的 密 钥 。 再 如 ,古代 武林 高 手 把 一 些 秘籍 通过 特定 的 
手段 写 到 羊皮 上 ,只 有 使 用 正确 的 方法 才能 看 到 上 面 的 内 容 , 战 争 年 代 聪 明 的 老百姓 也 发 
明了 在 煮 熟 的 鸡蛋 清 上 写字 的 方法 来 传递 情报 ,电视 剧 ( 连 城 决 ?中 的 终极 秘密 则 是 隐藏 
在 一 本 《唐诗 300 首 ) 书 中 。 

除了 可 以 设计 自己 的 加 密 算法 或 者 自己 编写 程序 实现 经 典 的 加 密 解 密 算 法 之 外 ,还 
可 以 充分 利用 Python 标准 库 和 扩展 库 提 供 的 丰富 功能 。Python 标准 库 hashlib 实现 了 
SHA1.SHA224,SHA256,SHA384, SHA512 以 及 MD5 等 多 个 安全 哈 希 算法 ,标准 库 
zlib 提供 了 adler32 和 crc32 算法 的 实现 ,标准 库 hmac 实现 了 HMAC 算法 。 在 众多 的 
Python 扩展 库 中 ,pycrypto 可 以 说 是 密码 学 编程 模块 中 最 成 功 也 是 最 成 熟 的 一 个 ,具有 
很 高 的 市 场 占有 率 。 另 外 ,cryptography 也 有 一 定数 量 的 用 户 在 使 用 。 扩 展 库 pycrypto 
和 cryptography 提供 了 SHA 系列 算法 和 RIPEMDI60 等 多 个 安全 哈 希 算法 ,以 及 DES、 
AES, RSA, DSA ,ElGamal 等 多 个 加 密 算 法 和 数字 签名 算法 的 实现 。 


14.1 经 典 密码 算法 


很 多 经 典 密码 算法 的 安全 性 很 低 ,甚至 很 容易 被 词 频 分 析 这 样 的 简易 攻击 手段 破解 ， 
因此 已 经 很 少 再 使 用 。 尽 管 如 此 ,经 典 密码 算法 的 一 些 思想 还 是 很 有 借鉴 意义 和 参考 价 
值 的 。 


1411 EREDAR 


已 撤 密 码 作 为 古老 的 加 密 算法 之 一 ,在 古 罗 马 的 时 候 就 已 经 广泛 使 用 了 。 恺 撤 密 码 
算法 的 基本 思想 是 : 通过 把 字母 移动 一 定 的 位 数 来 实现 加 密 和 解密 。 明 文中 的 所 有 字母 
都 在 字母 表 上 向 后 (或 向 前 ) 按 照 一 个 固定 数目 进行 偏 移 后 被 蔡 换 成 密 文 。 例 如 , 当 偏 移 
量 是 3 的 时 候 , 所 有 的 字母 A 将 被 蔡 换 成 D,B 变 成 下 ,以 此 类 推 ,X 将 变 成 A,Y ER B, 


426 $ Python 可 以 这 样 学 


Z 变 成 C。 移 动 的 位 数 就 是 已 撤 密 码 加 密 和 解密 的 密 钥 。 
例 14-1 已 撤 密 码 算法 。 


df KaiSeEncrypt (ch, k): 


if(not isinstance (ch, str))or len (ch) !=1: 
print ("The first parameter must be a character!) 
retum 


if (not isinstance(k, int))or(not 1<=k<=25): 
print ("The second parameter must be an integer between 1 and 25") 
retum 

# 把 英文 字母 变换 为 后 面 第 k 个 字母 

if 'a'C- d - enr (ord('z!')- k): 
return chr (ord (ch) * k) 

# 把 英文 字母 首尾 相连 

elif chr(ord('z')- k)« dx= 'z': 
return chr ( (ord (c) - ord('a')* k) $26* ord('a')) 

elif 'A'c- dx - ar (ord('Z')- k): 
return chr (ord (ch)+ k) 

elif chr (ord('Z')- k)«ac- 'Z': 
return chr ( (ord (d) - ord('A')* k)$26* ord('A')) 

else: 
return ch 


def encrypt (plain, k): 
retum ''.join([KaiSaEncrypt (ch, k)for ch in Plain]) 


def KaiSaDecrypt (ch, k): 
if(not isinstance(ch, str))or len(ch) !=1: 
print('The first parameter must be a character') 
retum 
if (not isinstance(k, int))or(not 1<=k<=25): 
print ("The second parameter must be an integer between 1 and 25') 
retum 
# 把 英文 字母 首尾 相连 ,然后 把 每 个 字母 变换 为 前 面 第 k 个 字母 
if chr(ord('a')* k)«- enc - 'z': 
return chr (ord (d) - k) 
elif 'a'c- dc chr (ord('a!)* k): 
retum chr((ord(dh)- k+ 26) ) 
elif chr (ord('A')* k)«- chc- 'Z': 
retum chr (ord (dh)- k) 
elif 'A'c- dic chr (ord ('A')+ k) : 
retum chr((ord(dh)- k* 26) ) 
else: 
return ch 


def decrypt (plain, k): 
retum ''.join([KaiSaDecrypt (ch, k) for ch in plain]) 


plainText- 'Explicit is better than implicit.' 
cipherText- encrypt (plainText, 5) 

print (plainText) 

print (cipherText) 

print (decrypt (cipherText, 5) ) 

程序 运行 结果 为 


Explicit is better than implicit. 
Jcugnhny nx gjyyjw ymfs nrugnhny. 
Explicit is better than implicit. 
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ANER: 这 里 的 代码 只 是 已 撒 密 码 的 原理 演示 ,实现 已 撒 加 密 其 实 不 用 这 么 麻 
烦 ,可 以 参考 第 5 章 中 关于 maketrans() 和 translate() 方 法 的 介绍 。 


1412 维 吉 尼 亚 密码 
维 吉 尼 亚 密码 算法 使 用 一 个 密 钥 和 一 个 表 来 实现 加 密 ,根据 明文 和 密 钥 的 对 应 关系 


进行 查 表 来 决定 加 密 结果 。 假 设 蔡 换 表 如 图 14-1 所 
示 , 最 上 面 一 行 表示 明文 ,最 左边 一 列表 示 密 钥 , 那 么 
二 维 表格 中 与 明文 字母 和 密 钥 字母 对 应 的 字母 就 是 加 
密 结果 。 例 如 ,单词 PYTHON 使 用 ABCDEF fit 4 
的 加 密 结果 为 PZVKSS。 

例 14-2 维 吉 尼 亚 密码 。 


fram string import ascii uppercase as uppercase 
fram itertools import cycle 


# 创 建 密码 表 
table- dict () 
for ch in uppercase: 
index- uppercase.index (ch) 
table[ch]- uppercase [index:]+ uppercase|:index] 


# 创 建 解密 密码 表 

deTable- {'A':'A'} 

start- 'Z' 

for ch in ugpercase[1:] : 
index- ugpercase. index (ch) 
deTable[ch]- chr (ord (start) * 1- index) 


图 14-1 


ABCDEFGHIJKLMNOPQRSTUVVXYZ 

A: ABCDEFGHITKLMNOPQRSTUVWXYZ 
B: BCDEFGHITKLMNOPQRSTUVWXYZA 
C:CDEFGHITKLNNOPQRSTUVVXYZAB 
i rac pip cca dd a 
LJKLNNOPQRSTUVWXYZABCD 

F PERTAIN PRS TOR YA DE 
e" GHIJKLMNOPQRSTUVWXYZABCDEF 
H: HIJKLNNOPQRSTUVVXYZABCDEFG 

I: IJKLMNOPQRSTUVVXYZABCDEFGH 
J:JKLMNOPQRSTUVVXYZABCDEFGHI 
X: KLNNOPQRSTUVVXYZABCDEFGHIT 
L:LMNOPQRSTUVVXYZABCDEFGHITK 
M: MNOPQRSTUVWXYZABCDEFGHIJKL 
N: NOPQRSTUVWXYZABCDEFGHITKLM 
O:0PQRSTUVWXYZABCDEFGHITKLMN 
P:PQRSTUVVXYZABCDEFGHITKLMNO 
Q:QRSTUVVXYZABCDEFGHIJKLMNOP 
R:RSTUVWEYZABCDEFGHIJKLMNOPQ 
S:STUVVXYZABCDEFGHIJKLMNOPQR 
T: TUVWXYZABCDEFGHIJKLINOPQRS 
U: UVVXYZABCDEFGHIJKLMNOPQRST 
V: VVXYZABCDEFGHIJKLMNOPQRSTU 
V: WEYZABCDEFGHIJKLMNOPQRSTUV 
X:XYZABCDEFGHIJKLMNOPQRSTUVV 
Y: YZABCDEFGHIJKLMNOPQRSTUVVX 
1: LABCDEFGHIJKLNNOPQRSTUVVXY 


维 吉 尼 亚 密码 替换 表 
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# 解 密 密 钥 
df deKey (ey) : 
return ''.join([deTable[i] for i in key]) 


mE ARE 
def encrypt (plainText, key): 
# 创 建 cycle 对 象 ,支持 密 钥 字母 的 循环 使 用 
currentKey- cycle (key) 
for ch in plainText: 
if 'A'S-dx- 'Z': 
index- uppercase.index (ch) 
# 获 取 密 钥 字母 
ck= next (currentKey) 
result.append(table[ck] [index]) 
else: 
result.append (dh) 
return ''.join(result) 


key= 'DONGEUGUO' 

Er 'EYTHON 3.5.1 PYTHON 2.7.11" 
c-encrypt (p, key) 

print (p) 

print (c) 

print (encrypt (c, deKey (key) ) ) 


1413 换 位 密码 算法 


换 位 密码 也 是 一 种 比较 常见 的 经 典 密码 算法 ,基本 原理 是 先 把 明文 按 固定 长 度 进行 
分 组 ,然后 对 每 一 组 的 字符 进行 换 位 操作 ,从 而 实现 加 密 。 例 如 ,字符 串 “Errors should 
never pass silently. ”使 用 密 钥 1432 进行 加 密 时 ,首先 将 字符 串 分 成 若干 长 度 为 4 的 分 
组 ,然后 对 每 个 组 的 字符 进行 换 位 ,第 1 个 字符 和 第 3 个 字符 位 置 不 变 , 把 第 2 个 字符 和 
第 4 个 字符 交换 位 置 , 得 到 “Eorrrs shluoden v repssa liseltny. ". 

例 14-3 换 位 密码 算法 。 


df encrypt (plainText, t): 
result= [] 
length- len (t) 
# 把 明文 分 组 
temp- [plainText[i:i* length] for i in range (0, len (plainText) , length) ] 
# 对 除 最 后 一 组 之 外 的 其 他 进行 换 位 处 理 
for item in temp[:- 1]: 
newItem- '' 
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for iint: 
newItem- newTtemt item[i- 1] 
result.append (newItem) 
retum ''.join(result)+ terp[- 1] 


p- 'Errors should never pass silently. ' 
# 加 密 

c- encrypt (p, (L, 4, 3, 2) 

print (c) 

# 解 密 

print (encrypt (c, (1, 4, 3, 2))) 


14.2 安全 哈 希 算法 


安全 哈 希 算法 也 称 为 报 文摘 要 算法 ,对 任意 长 度 的 消息 可 以 计算 得 到 固定 长 度 的 唯 
一 指纹 。 理 论 上 ,即使 是 内 容 非常 相似 的 消息 也 不 会 得 到 完全 相同 的 指纹 。 安 全 哈 硕 算 


也 经 常用 到 MD5 或 其 他 安全 哈 希 算法 ,用 来 验证 文件 发 布 之 后 是 否 被 非法 修改 。 
下 面 的 代码 使 用 Python 标准 库 hashlib 计算 字符 串 的 安全 哈 希 值 。 


> > > import hashlib 

>> > hashlib.md5 ('abodefg' .encode () ) .hexdigest () # 使 用 MD5 算 法 
>>> hashlib.sha512 ('abodefg' .encode () ) .hexdigest () # 使 用 sHa512 算 法 
>>> hashlib.sha256 ('abodefg' .encode () ) .hexdigest () HEJ sHa256 算 法 


Python 扩展 库 pycrypto 也 提供 了 MD2, MD4, MD5, HMAC, RIPEMD, SHA, 
SHA224,SHA256.SHA384, SH A512 等 多 个 安全 哈 希 算法 的 实现 。 


>> > fram Crypto.Hash import SHA256 
> > > h= SHA256.SHA256Hash (' abodefg' .encode ()) 
»»»h.hexdigest () 


例 14-4 计算 文件 的 MD5 值 。 
inport sys 

ámport hashlib 

ámport os.path 


filename- sys.argv[1] 

if os.path.isfile (filename): 
fp-cpen(filenme, 'rb') 
contents- fp.read() 
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s 
fp.close() 
print (hashlib.md5 (contents) .hexdigest () ) 
els: 
print ('file not exists') 
把 上 面 的 代码 保存 为 文件 CheckMD5OfFile. py, 然 后 计算 指定 文件 的 MD5 值 , 对 该 
文件 进行 微小 修改 后 再 次 计算 其 MD5 值 ,可 以 发 现 ,哪怕 只 是 修改 了 一 点 点 内 容 ,MD5 
值 的 变化 也 是 非常 大 的 ,如 图 14-2 所 示 。 


L'un am 


:Python35>echo hello world > test.txt 


:NPython355type test.txt 
llo world 


:NPython35?python CheckMDSOFPile.py test.txt 
df 02967b5ae298061dbi f 1ad2aG6b6b4 


:\Python35Yecho hello worldi > test.txt 


:\Python35>python CheckMDSOfFile.py test.txt 
idb543eUcf 5585aa6d72428cf e2e95 


:\Python35> 


图 14-2 计算 文件 的 MD5 值 


(以 拓展 知识 : MD5 算法 属于 单 向 变换 算法 ,不 存在 反 函 数 , 暴 力 测试 几乎 成 为 唯一 
可 能 的 MD5 破解 方法 。 下 面 的 代码 演示 了 通过 暴力 测试 来 破解 MD5 值 的 思路 ,当然 这 
个 思路 也 适用 于 SHA1 以 及 SHA224/256/384/512 系列 哈 希 值 的 破解 。 下 面 的 方法 使 
用 排列 算法 生成 指定 长 度 和 字符 集 的 所 有 可 能 明文 然后 逐个 尝试 ,也 可 以 参考 第 6 章 破 
解 RAR 和 ZIP 文件 密码 的 代码 改写 ,使 用 字典 文件 进行 破解 。 

from hashlib import md5 

frm string import ascii letters, digits 

fram itertools import permutations 


all letters-ascii letters digits* '.,;' # 候 选 字符 集 


def decrypt md5 md5 value): 


if len md5 value)!- 32: # 破 解 32 位 MD5 值 
print ('error') 
retum 
md5 value-mi5 value. lower () # 转 换 为 小 写 MD5 值 
for k in range(5,10) : # 预 期 密码 长 度 
for item in permitations(all letters, k): # 暴 力 测试 


item- ''.join (item 
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int(*.', end- *!) # 显 示 进 度 
if md5(item.encode()).hexdigest()-—md5 value: # 破 解 成 功 
return item 


md5 value= 'e7d057704ea5206d8db61280741238f5' 
start- time () 

result- decrypt md5(mi5 value) 

if result: 

print('WSuccess: '+md5 valuet '==> '+ result) 

print ("Time used:', time()- start) 

提 到 MD5 的 破解 ,就 不 得 不 说 一 下 我 见 过 的 一 个 聪明 人 。 几 年 前 他 搭建 了 一 个 很 
简单 的 网 页 ,页 面 上 只 提供 了 MD5 加 密 和 MD5 解密 两 个 按钮 。 当 用 户 使 用 加 密 功 能 
时 ,后 台 用 代码 调用 MD5 算法 计算 出 用 户 输入 信息 的 MD5 值 ,同时 把 原始 信息 和 对 应 
的 MD5 添加 到 数据 库 中 。 而 当 用 户 使 用 解密 功能 时 ,就 去 数据 库 中 查找 是 否 存 在 用 户 
输入 的 MD5 值 。 短 短 几 个 月 的 时 间 就 吸引 了 大 量 用 户 前 来 测试 (实际 上 是 免费 帮忙 扩 
充 数据 库 ) , 当 数 据 库 庞大 到 一 定 程度 以 后 ,作者 宣布 开始 收费 ,每 使 用 一 次 解密 功能 需要 
支付 一 块 钱 。 


者 编写 Python 程序 调用 ssdeep 提供 的 API 函数 来 计算 文件 的 模糊 哈 希 值 ,模糊 哈 希 值 
可 以 用 来 比较 两 个 文件 的 相似 百分比 。 这 个 工具 在 Windows 平台 上 安装 比较 麻烦 ,建议 
使 用 Linux 操作 系统 ,以 Ubuntu 为 例 ,执行 命令 sudo BUILD_LIB=1 pip3 install 
ssdeep 即 可 安装 ssdeep 和 所 有 依赖 包 , 当然 在 这 之 前 或 许 还 需要 使 用 sudo apt-get 
install python3-pip 命令 先 安 装 pip3 工具 。 


>>> import ssdeep 

>>> hashl= ssdeep.hash ('Also called fuzzy hashes, Ctph can match inputs that have hamologies.') 
>>>hashl 

'3:AXGBi cF1gUNhBGCLOWCEEQEV :AXGHsNhxLsr2C' 

>> > hash2- ssdeep.hash ('Also called fuzzy hashes, CTPH can match inputs that have hamologies. ') 
>>>hash2 

'3:AXGBi cFlIHEGCLÓWCrEQEv : AXGHGxLsr2C" 

>>> ssdeep.cumpare (hashl, hash2) # 比 较 两 个 哈 希 值 的 相似 度 
22 

>>> inport ssdeep 

»»»s-ssdeep() 

»»»s.hash fram file(filename) 


对 于 某 些 恶意 软件 来 说 ,可 能 会 对 自身 进行 加 壳 或 加 密 , 真 正 运行 时 再 进行 脱 壳 或 解 
密 , 这 样 一 来 ,会 使 得 磁盘 文件 的 哈 希 值 和 内 存 中 脱 过 或 解密 后 进程 的 哈 希 值 相差 很 大 。 
因此 ,根据 磁盘 文件 和 其 相应 的 进程 之 间 模 糊 哈 希 值 的 相似 度 可 以 判断 该 文件 是 否 包含 
自修 改 代码 ,并 以 此 来 判断 其 为 恶意 软件 的 可 能 性 。 
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14.3 对称 密 钥 密码 算法 DES 和 AES 


作为 经 典 的 对 称 密 钥 密码 算法 ,DES 早 在 1976 年 就 被 美国 政府 采用 ,随后 得 到 美国 
国家 标准 局 和 美国 国家 标准 协会 的 认可 ,并 成 为 全 球 范围 内 事实 上 的 工业 标准 。DES $$ 
法 使 用 56 位 密 钥 对 64 位 的 数据 块 进行 加 密 , 并 对 64 位 的 数据 块 进行 16 轮 编码 ,最 终 完 
成 变换 。 下 面 的 代码 演示 了 Python 扩展 库 pycrypto 中 DES 算法 的 用 法 。 


>>> frm Crypto.Cipher import DES 

>>> des encrypt decrypt- [ES.new ('ShanDong', DES.MODE ECB) 

»»»p- 'Beautiful is better than ugly." 

»»»pgp-p.encode () 

»»»c-des encrypt decrypt.encrypt (pp. ljust ( (len (po) //8* 1) * 8, b'0')) 


HE 8 字 节 对 齐 
»»»c # 加 密 结果 
b'Nxc3{pN\xldNx9F\xga\x850Nxf6:\3iar \xfc\xel. \xBea\xel\x9f291\xd7\xdfy\x94\xal \x0eNxd8\xaf\x89" 
>> > qr des_encrypt_decrypt.decrypt(c) # 解 密 


>>> 

b'Beautiful is better than ugly.00' 

>>> p[0:len (tp) ] decode () 

"Beautiful is better than ugly." 

高 级 加 密 标准 AES Advanced Encryption Standard) , X f& Jg Rijndael 算法 ,是 美国 
联邦 政府 采用 的 一 种 区 块 加 密 标 准 , 用 来 蔡 代 DES 算法 ,AES SEHE 68 HI CAR EA IL 4. 
在 软件 及 硬件 上 都 能 快速 地 加 解密 。AES 加 密 数据 块 分 组 长 度 必 须 为 128 位 , 密 钥 长 度 
可 以 是 128/192/256 位 中 的 任意 一 个 (数据 块 及 密 钥 长 度 不 足 时 需要 补 齐 )。 

例 14-5 使 用 Python 扩展 库 pycrypto 提供 的 AES 算法 实现 消息 加 密 和 解密 。 

import string 

inport random 


# 生 成 指定 长 度 的 密 钥 
def keyGenerater (length) : 
if length not in(16, 24, 32): 
return None 
x-string.ascii letters: string.digits 
return ''.join([randam.choice (x) for i in range (length) ]) 


def encryptor decryptor (key, mode): 
return AES.new (key, mode, b'0000000000000000' ) 


# 使 用 指定 密 钥 和 模式 对 给 定 信息 进行 加 密 
def AESencrypt (key, mode, text): 
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encryptor- encryptor decryptor (key, mode) 
return encryptor.encrypt (text) 


# 使 用 指定 密 钥 和 模式 对 给 定 信息 进行 解密 


text= ' 山 东 省 烟台 市 Python3.5 is excellent." 
key- keyGenerater (16) 
# 随 机 选择 nes 的 模式 
mode- randam.choice((AES.MODE CBC，RES.MDDE CFB, AES.MOE ECB, 
ES.MDDE CFB)) 
if not key: 
print ('Samething is wrong.) 
else: 
print ('key:', key) 
print ('mode:', mode) 
print ('Before encrypted:', text) 
# 明 文 必 须 以 字 节 串 形式 , 且 长 度 为 16 的 倍数 
text_encoded= text.encode () 
text length- len (text encoded) 
padding length= 16- text_lengths16 
text encoded- text encoded b'0' * padding length 
text encrypted- AESencrypt (key, mode, text encoded) 
print('After encrypted:', text encrypted) 
text decrypted = AESdecrypt (key, mode, text encrypted) 
print('After decrypted:', text decrypted.deocde() [:- padding length]) 


14.4 非 对 称 密 钥 密码 算法 RSA 与 数字 签名 算法 DSA 


1441 RSA 


RSA 是 一 种 典型 的 非 对 称 密 钥 密 码 体制 ,从 加 密 密 钥 和 解密 密 钥 中 的 任何 一 个 推导 
出 另 一 个 在 计算 上 是 不 可 行 的 。RSA 的 安全 性 建立 在 “大 数 分 解 和 素性 检测 ”这 一 著名 
数论 难题 的 基础 上 。 公 钥 对 可 以 完全 公开 ,不 需要 进行 保密 ,但 必须 提供 完整 性 检测 机 制 
以 保证 不 受 算 改 ; 私 钥 由 用 户 自己 保存 。 通 信 双 方 无 须 实现 交换 密 钥 就 可 以 进行 保密 
通信 。 

RSA 密码 体制 算法 如 下 。 

COD 由 用 户 选择 两 个 互 异 并 且 距 离 较 远 的 大 素数 p 和 g。 

(2) 计算 n=pXg 和 f()=(p 一 1) X(g 一 1)。 
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(3) 选择 正 整数 e, 使 其 与 7Cz) 的 最 大 公约 数 为 1; 然 后 计算 正 整 数 d, 使 得 eX4d 对 
FORRA 1. Bl eX d—1 mod f(n) ,最 后 销毁 p Hq. 

经 过 以 上 步骤 ,得 出 公 钥 对 (n,e) 和 私 钥 对 (n,d)。 设 M 为 明文 ,C 为 对 应 的 密 文 , 则 
加 密 变换 为 : C— M" mod n; 解 密 变 换 为 : M 二 CU mod n. 

Python 扩展 模块 rsa 封装 了 RSA 算法 ,可 以 方便 地 使 用 该 算法 生成 密 钥 以 及 加 


解密 。 
>>> import rsa 
>>> key- rsa.newkeys (3000) # 随 机 生成 密 钥 
»»»private- key[1] # 查 看 私 钥 分 量 ,输出 结果 略 


»»»print(private.d, private.e, private.n, private.p, private.d) 


014-6 ”使 用 rsa 模块 来 实现 消息 加 密 和 解密 。 


inport rsa 

key- rsa.newkeys (3000) # 生 成 随机 密 钥 
privateKey- key[1] # 私 钥 
publickey- key[0] # 公 钥 


message= ' 中 国 山东 烟台 .Now is better than never." 
print ('Before encrypted: ' ,message) 
message- message .encode () 


cryptedMessage- rsa.encrypt (message, publicKey) 
print('After encrypted: Wn', cryptedMessage) 


message rsa.decrypt (cryptedMessage, privateKey) 

message= message. decode () 

print ('After decrypted: ' message) 

Python 扩展 库 pycrypto 也 封装 了 RSA 算法 以 及 DSA 和 ElGamal 算法 ,可 用 于 数 
字 签 名 和 其 他 相关 领域 。 在 使 用 之 前 ,需要 将 pycrypto 安装 目录 中 的 Crypto/Random/ 
OSRNG/nt. py 文件 中 的 


import winrandem 
一 行 改 为 
下 面 的 代码 演示 了 如 何 使 用 pycrypto 提供 的 RSA 模块 进行 加 密 和 解密 。 


> > > fram Crypto.PublicKey import RSA 

>>> key- FSA.generate (2048) # 生 成 密 钥 ,查看 密 钥 各 分 量 的 值 ,输出 结果 略 
>>>Print (key.key.n, key.key.p, key.key.e, key.key.d) 

»»»p-'Flat is better than nested. 中 文 测试 ' 
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>>> c= key.encrypt (p.encode (), key) 

>>> qp- key.decrypt (c) 

>>> cp.decode () 

"Flat is better than nested. 中 文 测试 ' 

>>> k= key.exportKey ('EEM') # 密 钥 导 出 

>>> keyl- RSA.importKey (k) # 密 钥 导 入 

>>> keyl == key 

True 

>>> fp open('D:\\Key.pem', 'wb') 

>>> fp.write (key.exportKey ('FEM')) # 将 密 钥 导出 到 文件 
1674 

>>> fp.close() 

>>> fp- qen ('D:\ \Key.pem', 'rb!) 

>>> key2- RMA. importKey (fp.read()) # 从 文件 中 导入 密 钥 
>>> fp.close() 

>>> key2 ==key 

True 


1442 DSA 


DSA 是 基于 公 钥 机 制 的 数字 签名 算法 ,其 安全 性 基于 离散 对 数 问题 DLP, 即 给 定 一 
个 循环 群 中 的 元 素 g 和 h, 很 难 找到 一 个 整数 x 使 得 g^x=h。 下 面 的 代码 简单 演示 了 
pycrypto 扩展 库 中 DSA 算法 的 用 法 。 


> > > fram Crypto.Randcm import random 
> > > fram Crypto.PublicKey import DSA 


>>> fran Crypto.Hash import MD5 
>> > message= 'Sinple is better than camplex.' 

>>> key- DSA.generate (1024) # 生 成 密 钥 

>>> h- ME.rew(ressecp.encode ()) digest () SEG BLUR d (C 


»»»k-randam.StrongRandam() .randint (1, key.key.q- 1) 
»»»sig-key.sign(h, k) 

»»»key.verify(h, sig) 

True 

>>>hl=MD5.new (message .encode () * b'3') .digest () 
>>> key.verify(hl, sig) 

False 
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Python 标准 库 tkinter 是 对 Tcl/Tk 的 进一步 封装 ,与 tkinter. ttk 和 tkinter. tix 共同 
提供 了 强大 的 跨 平 台 图 形 用 户 界面 (Graphical User Interface. GUD 编程 的 功能 ,IDLE 
就 是 使 用 tkinter 进行 开发 的 。tkinter 提供 了 大 量 用 于 GUI 编程 的 组 件 , 表 15-1 列 出 了 
其 中 一 部 分 。 另 外 ,tkinter. ttk 还 提供 了 Combobox, Progressbar 和 Treeview 等 组 件 ， 
tkinter. scrolledtext 提供 了 带 滚动 条 的 文本 框 , messagebox, commondialog、 dialog, 
colorchooser simpledialog ,filedialog 等 模块 提供 了 各 种 对 话 框 。 本 章 并 没有 一 一 介绍 每 
个 组 件 的 属性 和 方法 ,而 是 通过 大 量 实用 性 很 强 的 案例 来 演示 这 些 组 件 的 用 法 ,每 个 案例 
都 附加 了 大 量 注 释 来 方便 大 家 理解 。 


X 15-1 tkinter 的 常用 组 件 


组 件 名 称 说 有明 
Button 按钮 
Canvas 画布 ,用 于 绘制 直线 ,椭圆 、 多 边 形 等 各 种 图 形 
Checkbutton 复 选 框 形式 的 按钮 
Entry 单行 文本 框 
Frame 框架 ,可 作为 其 他 组 件 的 容器 ,常用 来 对 组 件 进行 分 组 
Label 标签 ,常用 来 显示 单行 文本 
Listbox 列表 框 
Menu 菜单 
Message 多 行文 本 框 
Radiobutton 单 选 按钮 ,同一 组 中 的 单 选 按钮 任何 时 刻 只 能 有 一 个 处 于 选中 状态 
Scrollbar 滚动 条 
Toplevel 常用 来 创建 新 的 窗口 


15.1 用 户 登 录 界 面 


用 户 登 录 界 面 几 乎 无 处 不 在 ,如 电子 邮箱 .QQ、 微 信 、 论 坛 、 微 博 、 办 公 系 统 、 各 类 管 
理 信 息 系统 等 都 需要 登录 账号 才能 进行 后 续 的 操作 。 一 般 而 言 ,用 户 密 码 都 是 经 过 安全 
哈 希 算法 加 密 之 后 存储 到 数据 库 中 的 ,并 不 直接 保存 明文 。 下 面 的 案例 主要 演示 如 何 使 
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用 tkinter 创建 应 用 程序 窗口 ,以 及 文本 框 按 钮 和 简单 消息 框 等 组 件 的 用 法 。 
例 15-1 tkinter 实现 用 户 登录 界面 。 


import tkinter 
inport tkinter.messagebox 


# 创 建 应 用 程序 窗口 

root- tkinter.Tk() 

varName- tkinter.StringVar () 

varNeme.set ('') 

varPwd tkinter.StringVar () 

varPwd.set ('') 

# 创 建 标签 

labelName- tkinter.label(root, text= "User Neme:', justify= tkinter.RIGHT, 
width- 80) 

# 将 标签 放 到 窗口 上 

labelName.place (x-10, y-5, width- 80, height= 20) 

# 创 建文 本 框 ,同时 设置 关联 的 变量 

entryName- tkinter.Entry (root, width- 80,textvariable= varName) 

entryName.place (x= 100, y- 5, width- 80, height= 20) 


labelPwd tkinter.label(root, text= 'User Pwd:', justify- tkinter.RIGHT, width= 80) 
labelPwd.place(x-10, y= 30, width- 80, height= 20) 
# 创 建 密码 文本 框 
entryPwd- tkinter.Entry(root, show- ' * ',width= 80, textvariable- varPwd) 
entryPwd.place (x= 100, y= 30, width= 80, height= 20) 
# 登 录 按钮 事件 处 理 函 数 
cef login( : 

# 获 取 用 户 名 和 密码 

name= entryName..get () 

pwè entryPwd.get () 

if name-- "admin' and pwd- = '123456' : 

tkinter.messagebox.showinfo (title= 'Python tkinter',message- 'OK') 
else: 
tkinter.messagebox.showerror ('Python tkinter', message- 'Error') 

# 创 建 按钮 组 件 , 同 时 设置 按钮 事件 处 理 函 数 
dbuttonOk- tkinter.Button (root, text= 'Login', camand- login) 
buttonOk.place (= 30, y= 70, width- 50, height= 20) 
# 取 消 按钮 的 事件 处 理 函 数 
def cancel(): 

# 清 空 用 户 输入 的 用 户 名 和 密码 

varName.set ('') 

varPwd.set ('"') 
buttoncancel= tkinter.Button (root, text= 'Canoel', command cancel) 
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dbuttonCanoel.place (x= 90, y= 70, width= 50, height= 20) 


Un zt B 

rcot.mainlocp() 

将 上 面 的 代码 保存 为 tkinter login. pyw, 运 行 结果 如 图 15-1 所 示 ,如 果 用 户 输入 
用 户 名 admin 和 密码 123456 并 单 击 Login 按钮 ,弹出 密码 正确 对 话 框 ( 见 图 15-2)， 
否则 弹出 密码 错误 对 话 框 ( 见 图 15-3) 。 单 击 Cancel 按钮 可 以 清空 已 输入 的 用 户 名 


和 密码 。 
1 Python tinter [Ez] | 
ANE 
C — e- 
-tegin | Cancel] P 
图 15-1 用 户 登录 界面 图 15-2 密码 正确 图 15-3 ”密码 错误 


15.2 选择 类 组 件 应 用 


下 面 的 案例 创建 了 一 个 包含 文本 框 , 单 选 按 钮 . 复 选 框 、 组 合 框 ,按钮 和 列表 框 等 组 件 
的 GUI 应 用 程序 ,运行 后 输入 学 生 姓名 并 选择 年 级 .班级 .性 别 以 及 是 否 是 班长 等 信息 
后 , 单 击 Add 按钮 可 将 该 学 生 信 息 添加 到 列表 框 中 。 在 列表 框 中 选择 一 项 后 单 击 
DeleteSelection 按钮 可 将 其 从 列表 框 中 删除 ,没有 选择 任何 项 而 直接 单 击 该 按钮 则 提示 


No Selection, 
例 15-2. tkinter 单 选 按钮 、 复 选 框 ` 组 合 框 \ 列 表 框 综合 运用 案例 。 
import tkinter 


# 创 建 tkinter 应 用 程序 

root- tkinter.Tk() 

# 设 置 窗口 标题 
root.title('Selection widgets') 
# 定 义 窗口 大 小 
root['height']- 400 

root ['width']- 320 

# 与 姓名 关联 的 变量 

varName- tkinter.StringVar () 
varName.set ('') 
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# 创 建 标签 ,然后 放 到 窗口 上 

labelName- tkinter.label (root, text= "Name: ', justify- tkinter.RIGHT, width 50) 
labelName.place (x-10, y-5, width- 50, height= 20) 

# 创 建文 本 框 ,同时 设置 关联 的 变量 

entryName- tkinter.Entry (root, width= 120, textvariable= varName) 
entryName.place (= 70, y=5, width=120, height= 20) 


labelGrade- tkinter.label (root, text= 'Grade:', justify- tkinter.RIGHT, width= 50) 
labelGrade.place (x= 10, y= 40, width= 50, height= 20) 
# 模 拟 学 生 所 在 年 级 ,字典 键 为 年 级 ,字典 值 为 班级 
studentClasses- (*1*:[*1*, '2*, '3', '4'], 
pi 
‘rt a 
# 学 生 班级 组 合 框 
ConiboGrade= tkinter.ttk.Coambobox (root, width 50, 
values- tuple (studentClasses.keys ()) ) 
carboGrade.place (x= 70, y= 40, width= 50, height= 20) 
# 事 件 处 理 函 数 
def omboChang (event) : 
grade- omboGrade .get () 
if grade: 
# 动 态 改变 组 合 框 可 选项 
canbcClass ["values"]- studentClasses.get (grade) 
else: 
coriboclass.set([]) 
# 九 定 组 合 框 事件 处 理 函 数 
coniboGrade.bind('< < ConbcboxSelected> > ', canboChange) 


]abelclass= tkinter.Label (root, text= 'Class:', justify- tkinter.RIGHT, width- 50) 
labelClass.place (= 130, y= 40, width- 50, height= 20) 

# 学 生年 级 组 合 框 

carboclass= tkinter.ttk.Corbabox (root, width= 50) 

cxnibcClass.place (= 190, y= 40, width- 50, height= 20) 


labelSex- tkinter.label (root, text= 'Sex:', justify- tkinter.RIGHT, width= 50) 
labelSex.place (x-10, y= 70, width- 50, height= 20) 

# 与 性 别 关联 的 变量 ,1: 男 ;0: 女 ,默认 为 男 

se tkinter. IntVar () 

sex.set(1) 

# 单 选 按钮 , 男 


xadicMan- tkinter.Radicbutton (root, variable- sex, value- 1, text 'Man") 
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radicMan.place (x- 70, y= 70, width= 50, height= 20) 
# 单 选 按钮 , 女 
radicWaman- tkinter.Radicbutton (root, variable- sex, value- 0, text= 'Waman') 
radicWaman.place (x- 130, y= 70, width= 70, height= 20) 
# 与 是 否 是 班长 关联 的 变量 ,默认 当前 学 生 不 是 班长 
monitor- tkinter.IntVar() 
monitor.set (0) 
# 复 选 框 ,选中 时 变量 值 为 1 未 选中 时 变量 值 为 0 
checkMpnitor= tkinter.Checkbutton (root, text= 'Is Monitor? ', variable- monitor, 
onvalue- 1, offvalue- 0) 
checkMonitor.place(x- 20, y= 100, width=100, height= 20) 
# 添 加 按钮 单 击 事件 处 理 函 数 
def addInformation(): 
result- "Name: '+ entryName.get () 
result- result* ';Grade: '+ caniboGrade.get () 
result- result+ ';Class: '+ canboClass.get () 
result- result+ ';Sex:' + ('Man' if sex.get()else 'Waman') 
result- result+ ';Monitor:' + ('Yes' if monitor.get()else 'No') 
listboxStudents.insert(0, result) 
buttonAdd- tkinter.Button (root, text= 'Ac',width- 40, camand- acdInformation) 
buttonAcd.place (= 130, y= 100, width- 40, height= 20) 
# 删 除 按钮 的 事件 处 理 函 数 
def deleteSelection(): 
selection- listboxStudents.curselecticn () 
if not selection: 
tkinter.messagebox.showinfo (title= 'Information', 
message- 'No Selection') 
else: 
listboxStudents.delete (selection) 
buttonDelete- tkinter.Button(root, text- 'DeleteSelection', 
width= 100, command deleteSelection) 
buttonDelete.place (x= 180, y- 100, width= 100, height= 20) 
# 创 建 列表 框 组 件 
listboxStudents- tkinter.Listbox (root, width= 300) 
listboxStudents.place (x-10, y= 130, width= 300, height= 200) 
# 启 动 消息 循环 
root.mainlocp() 


将 上 面 的 代码 保存 为 tkinter selction. pyw 文件 ,运行 后 效果 如 图 15-4 所 示 。 
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Name: (Wang Wu 
Grade 1 ~ Cas 3 - 


Sec  @ Man C Woman 


厂 Is Monitor? Add | DeleteSelection 


lame:Wang Wu;Grade:1;Class:3;Sex:Man;Monitor:t 
lame3KPU;Grade:1;Class:3;'SexMan;Monitor:No 
lame3KPU;Grade:1;Class:2/5exWoman;Monitor:No 
lame3KR;Grade:1;Class:2/SexWoman;Monitor:No 
lame3K—:Grade:l;Class:2:SexMan;Monitor:Yes 


图 15-4 程序 运行 效果 


15.3 简单 文本 编辑 器 


下 面 的 案例 通过 设计 一 个 文本 编辑 器 演示 了 菜单 ,文本 框 \ 文 件 对 话 框 等 组 件 的 用 
法 ,实现 了 打开 文件 .保存 文件 .另存 文件 以 及 文本 的 复制 . 剪 切 .粘贴 和 查找 等 功能 。 
例 15-3 使 用 tkinter 实现 文本 编辑 器 。 


import tkinter 
import tkinter.filedialog 


# 创 建 应 用 程序 窗口 

ap tkinter.Tk() 

&pp.title('My Notepad- - - - by Dong Fuguo") 
app['width']- 800 

appl 'height']= 600 


textChanged- tkinter.IntVar (value= 0) 
# 当 前 文件 名 


filename- '' 


# 创 建 菜单 
menw tkinter.Menu (app) 
#File 菜 单 
sumen tkinter.Menu (menu, tearoff- 0) 
def Open() : 
glcbal filename 


# 如 果 内 容 已 改变 , 先 保存 
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if textChanged.get () : 
yesno- tkinter.messagebox.askyesno (title= 'Save or not? ', 
message- 'Do you want to save? ') 
if yesno == tkinter.YES: 
Save() 
filename- tkinter.filedialog.askopenfilename (title- 'Open file', 
filetypes- [("Text files', '* .txt')]) 
if filename: 
# 清 空 内 容 ,0.0 是 linsNumber.Columm 的 表示 方法 
txtContent.delete(0.0, tkinter.END) 
fp- open (filename, 'r') 
txtContent.insert (tkinter.INSERT, ''.join(fp.readlines ())) 
fp.close() 
# 标 记 为 尚未 修改 
textChanged. set (0) 
# 创 建 open 菜 单 并 绑 定 菜单 事件 处 理 函 数 
submenu.add command (label= 'Open', cammand- Open) 


def Save() : 
global filename 
# 如 果 是 第 一 次 保存 新 建文 件 , 则 打开 "另存 为 "窗口 
if not filename: 
SaveAs () 
# 如 果 内 容 发 生 改变 ,保存 
elif textChanged.get () : 
fp- open (filename, 'w') 
fp.write(txtContent.get (0.0, tkinter.END)) 
fp.close() 
textChanged. set (0) 
submenu.add command(label- 'Save', cammand- Save) 


def SaveAs() : 
glcbal filename 
HIF" EA "TET 
newfilename- tkinter. filedialog. asksaveasfilename (title= ' Save As', initialdir- r'c:\\', 
initialfile- 'new.txt') 
# 如 果 指 定 了 文件 名 , 则 保存 文件 
if newfilename: 
fp-cpen(newfilename, 'w') 
fp.write(txtContent.get (0.0, tkinter.END)) 
fp.close() 
filename- newfilename 
textChanged.set (0) 
Submenu.add command (label= 'Save As', command SaveAs) 
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# 添 加 分 割 线 
sutmenu.add separator () 
def Close(): 
gldbal filename 
Save() 
txtContent.delete(0.0, tkinter.END) 
# 置 空 文件 名 
filename- '" 
Submenu.add command (label= 'Close', command Close) 
# 将 子 菜单 关联 到 主 菜单 上 
menu.add cascade (label= 'File', menu- submenu) 


#Edit 菜 单 
siene tkinter.Menu (menu, tearoff- 0) 
# 撤 销 最 后 一 次 操作 
def Undo() : 
# 启 用 undo 标 志 
txtContent [ 'undo']- True 
try: 
txtContent.edit undo() 
except Exception as e: 
pass 


submenu.add command (label= 'Undo', cammand- Undo) 


def Redo() : 
txtContent [ 'undo' ]- True 
try: 
txtContent.edit redo() 
except Exception as e: 
pass 
submenu.add command (label= 'Redo', cammand- Redo) 
sumenu.add separator () 


def Copy : 

txtContent.clipboard clear() 

txtContent.clipboard append(txtContent.selection get()) 
submenu.add comand (label= 'Copy', ocammnd- Copy) 


def Cut  : 
Copy 
# 删 除 所 选 内 容 
txtContent.delete (tkinter.SEL FIRST, tkinter.SEL IAST) 
sutmenu.adi omand (label= 'Cut', oammnd- Cut) 
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def Paste() : 
# 如 果 没 有 选中 内 容 , 则 直接 粘贴 到 鼠标 位 置 
# 如 果 有 所 选 内 容 , 则 先 删 除 再 粘贴 
try: 
txtContent.insert (tkinter.SEL FIRST, txtContent.clipboard get()) 
txtContent.delete (tkinter.SEL FIRST, tkinter.SEL IAST) 
# 如 果 粘 贴 成 功 就 结束 本 函数 ,以 免 异常 处 理 结构 执行 完成 之 后 再 次 粘贴 
retum 
exoept Exoeption as e: 
pass 
txtContent.insert (tkinter.INSERT, txtContent.clipboard get ()) 
submenu.add omand (label= 'Paste', omand Paste) 
submenu.add separator () 


def Search() : 

# 获 取 要 查找 的 内 容 

textToSearch- tkinter.simpledialog.askstring(titler 'Search', 

prampt- "What to search? ') 
start- txtContent.search(textToSearch, 0.0, tkinter.END) 
if start: 
tkinter.messagebox.showinfo (title= 'Found', message- 'Ok') 

submenu.add coammend(label- 'Search', oommand- Search) 
menu.add cascade (label= 'Edit', menu- submenu) 


#Help 菜 单 
siene tkinter.Menu (menu, tearoff- 0) 
def About () : 
tkinter.messagebox.showinfo (title= 'About', message- 'Author:Dong Fuguo') 
submenu.add command (label= 'Abcut', coammand- About) 
menu.add cascade (label= 'Help', menu- submenu) 
# 将 创建 的 菜单 关联 到 应 用 程序 窗口 
app.config (menu- menu) 


# 创 建文 本 编辑 组 件 ,并 自动 适应 窗口 大 小 
txtContent- tkinter.scrolledtext.ScrolledText (app, wrap- tkinter.WORD) 
txtContent.pack(fill- tkinter.BOTH, expand tkinter.YES) 
def KeyPress (event) : 
textChanged.set (1) 
txtContent.bind('« KeyPress» ', KeyPress) 


app.mainloop() 
运行 结果 如 图 15-5 所 示 。 
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[Python 3.x is a new version of the language, which is 

incompatible with the 

2.x line of releases. The language is mostly the same, but 

many details, 

especially how built-in objects like dictionaries and 
rings work, 

[have changed considerably, and a lot of deprecated features 

have finally 

[been removed. 


Puild Instructions 


|on Unix, Linux, BSD, OSX, and Cygwin: 


图 15-5 简单 文本 编辑 器 


15.4 简单 画图 程序 


下 面 的 程序 实现 了 简单 的 画图 功能 ,包括 曲线 .直线 矩形、 文本 的 绘制 ,前 景色 和 背 
景色 的 选取 和 设置 ,图 片 文件 的 打开 与 显示 ,以 及 橡皮 擦 功能 ,主要 使 用 了 canvas 和 
menu 组 件 , 男 外 还 用 到 了 颜色 选择 对 话 框 ,同时 还 演示 了 鼠标 事件 处 理 函 数 的 运用 。 

例 15-4 使 用 tkinter 实现 画图 程序 。 


import tkinter 
fram PIL import Image 


ap tkinter.Tk() 
app.title('My Paint- - - - by Dong Fuguo') 
appl 'width']= 800 
appl 'height']= 600 


# 控 制 是 否 允 许 画图 的 变量 ,1 为 允许 ,0 为 不 允许 

yesno- tkinter.IntVar (value- 0) 

# 控 制 画 图 类 型 的 变量 ,1 为 曲线 ,2 为 直线 ,3 为 矩形 ,4 为 文本 ,5 为 橡皮 
what- tkinter.IntVar (value= 1) 

# 记 录 鼠 标 位 置 的 变量 

X- tkinter.IntVar (value= 0) 

Y-tkinter.IntVar (value= 0) 

# 前 景色 

foreColor- '#000000' 

backColor- '#FFFFFF' 
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# 创 建 画 布 
imag tkinter.EFhotoTmage () 
canvas- tkinter.Canvas (app, bg- 'white', width= 800, height= 600) 
canvas.create image(B00, 600, image- image) 
idi ,允许 画图 
def onLeftButtonDown (event) : 
yesno.set (1) 
X.set (event..x) 
Y.set (event. y) 
if what.get()--4: 
# 输 出 文本 
canvas.create text (event.x, event.y, text= text) 
canvas.bind('« Button- 1» ', onLeftButtonDown) 


# 记 录 最 后 绘制 图 形 的 id 
lastDraw- 0 
# 按 住 鼠 标 左 键 移动 ,画图 
def onLeftButtorMove (event) : 
if yesno.get ()» — 0: 
retum 
if what.get ()==1: 
# 使 用 当前 选择 的 前 景色 绘制 曲线 
canvas.create line(X.get(), Y.get(), event.x, event.y, fill- foreColor) 
X.set (event .x) 
Y.set (event. y) 
elif what.get ()==2: 
HRM ELA , 先 删除 刚刚 画 过 的 直线 ,再 画 一 条 新 的 直线 
glcbal lastDraw 
try: 
canvas.delete (lastDraw) 
except Exception as e: 
pass 
lastDraw-canvas.create line(X.get(), Y.get(), event.x, event.y, 
fill- foreColor) 


elif what.get()-—- 3: 
# 绘 制 矩形 , 先 删除 刚刚 画 过 的 矩形 ,再 画 一 个 新 的 矩形 
glcbal lastDraw 
try: 
canvas.delete (lastDraw) 
except Exoeption as e: 
pass 
lastDraw-canvas.create rectangle (X.get (), Y.get(), event.x, event.y, 
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fill-backColor, outline- foreColor) 
elif what.get ()-— 5: 
# 橡 皮 , 使 用 背景 色 填充 10X 10 的 矩形 区 域 
canvas.create rectangle (event.x- 5, event.y- 5, event.x+ 5, event.yt 5, 
outline- backColor, fill- backColor) 
canvas.bind('« Bl- Motion» ', onLeftButtonMove) 


# 鼠 标 左 键 抬 起 ,不 允许 画图 


# 绘 制 直 线 
canvas.create line(X.get(), Y.get(), event.x, event.y, fill- foreColor) 
elif what.get ()- - 3: 
# 绘 制 矩形 
canvas.create rectangle (X.get ()，Y.get () ，event.xy， event.y, 
fill-backColor, outline- foreColor) 


yesno.set (0) 
global lastDraw 
lastDraw- 0 
canvas.bind('« ButtonRelease- 1» ', onLeftButtonUp) 


# 创 建 菜单 
menu- tkinter.Menu (app, tearoff- 0) 
# 打 开 图 像 文 件 
def open () : 
filename- tkinter.filedialog.askopenfilename (title= 'Open Image', 
filetypes- [('image', '* .jpg * .png * .gif')]) 
if filename: 
glcbal image 
image tkinter.FPhotolmage (file= filename) 
canvas.create image(80, 80, image- image) 
menu.acd command (label= 'Open', cammand- Open) 
# 添 加 菜单 ,清除 绘制 的 所 有 图 形 
def Clear(): 
for item in canvas.find all(): 
canvas.delete (item) 
menu.add command (label= 'Clear', oumand- Clear) 


# 添 加 分 割 线 
menu.add separator () 
# 创 建 子 菜单 ,用 来 选择 绘图 类 型 


menuType- tkinter.Menu (menu, tearoff- 0) 
def drawCurve() : 
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what.set (1) 
menuType.add oammand(label- 'Curve', omand drawCurve) 
def drawline() : 
what.set (2) 
menuType.add command (label= 'Line', comand drawline) 
def drawFectangle () : 
what.set (3) 
menuType.add comand (label= 'Rectangle', command drawRectangle) 
def drawText () : 
gldbal text 
text= tkinter.simpledialog.askstring(title- 'Input what you want to draw', prampt- '') 
what.set (4) 
menuType.add command (label= "Text', command drawText) 
menuType.add separator () 
# 选 择 前 景色 
de£ chooseForeColor () : 
global forecolor 
foreColor- tkinter.colorchooser.askcolor () [1] 
menilyce.acH omend (label= 'Choose Foreground Color', ommend dooseForeColor) 
# 选 择 背景 色 
def chooseBackColor () : 
glcbal backColor 
backColor= tkinter.colorchooser.askoolor () [1] 
menulype.acH omend (label= 'Choose Background Color', ommand dooseBackOolor) 
# 橡 皮 
def cnErase() : 
what.set(5) 
menuType.add command (label= 'Erase', ommand= onErase) 
menu.add cascade (label= "Type', menu- menuType) 


# 鼠 标 右 键 抬 起 ,在 鼠标 位 置 弹出 菜单 
def oriRightButtonUp (event) : 

menu.post(event.x root, event.y root) 
canvas.bind('« ButtonRelease- 3» ', onRightButtonUp) 
canvas.pack(fill- tkinter.BOTH, expand- tkinter.YES) 


app.mainlocp() 
程序 运行 结果 如 图 15-6 所 示 。 


Written in Python 
Erase 


Choose Foreground Color 
Choose Background Color 
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图 15-6 简单 画图 程序 


15.5 电子 时 钟 


下 面 的 案例 实现 了 电子 时 钟 , 使 用 Label 组 件 实时 显示 当前 日 期 和 时 间 ,涉及 的 知识 
主要 有 多 线程 .无 标题 栏 , 半 透明 、 顶 端 显 示 、 可 拖 动 窗 体 的 设计 。 


例 15-5 使 用 tkinter 实现 电子 时 钟 。 


import tkinter 
import threading 
import datetime 
import time 


app- tkinter.Tk() 

# 不 显示 标题 栏 

app.overrideredirect (True) 

# 半 透明 窗 体 

app.attributes ('- alpha', 0.9) 

# 窗 口 总 是 在 顶端 显示 

app.attributes('- topmpst'，1) 

# 设 置 初始 大 小 与 位 置 

abp.geametry("110X 25+ 100+ 100") 
labelDateTime- tkinter.Iabel (app) 
labelDateTime.pack(fill- tkinter.BOTH, expand tkinter.YES) 
labelDsteTime.ccnfigure (bg- 'gray") 

PER x 和 Y 用 来 记录 鼠标 左 键 按 下 的 位 置 
X- tkinter. IntVar (value= 0) 

Y= tkinter.IntVar (value= 0) 

# 表 示 窗 口 是 否 可 拖 动 的 变量 
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carMove- tkinter.IntVar (value= 0) 
# 表 示 是 否 仍 在 运行 的 变量 
still-tkinter.IntVar (value= 1) 


def onLeftButtonDown (event) : 

# 开 始 拖 动 时 增加 透明 度 

app.attributes ('- alpha', 0.4) 

# 鼠 标 左 键 按 下 ,记录 当前 位 置 

X.set (event..x) 

Y.set (event. y) 

# 标 记 窗口 可 拖 动 

carMpve.set (1) 
# 绑 定 鼠标 左 键 单 击 事件 处 理 函 数 
labelDateTime.bind('< Button- 1» ', onLeftButtonDown) 


def onleftButtonUp (event) : 

# 停 止 拖 动 时 恢复 透明 度 

app.attributes ('- alpha', 0.9) 

# 鼠 标 左 键 抬 起 ,标记 窗口 不 可 拖 动 

carMove.set (0) 
# 绑 定 鼠 标 左 键 抬 起 事件 处 理 函 数 
labelDateTime.bind('« ButtonRelease 1» '，cnLeftButtonUp) 


def onLeftButtorMove (event) : 

if carMove.get ()7 — 0: 

retum 

# 重 新 计算 并 修改 窗口 的 新 位 置 

newX- app.winfo x()* (event.x- X.get ()) 

newY- app.winfo y()* (event.y- Y.get ()) 

g- '110x25* '+ str (newX)+ '+ '+ str (newY) 

app-gearetry (g) 
HIRIE BUR Zc BEES Zh IE fF AE FE PR C 
labelDateTime.bind('« Bl- Motion» ', onLeftButtonMove) 


def onRightButtonDown (event) : 

still.set(0) 

t.join(0.2) 

# 关 闭 窗口 

app.destroy () 
# 绑 定 鼠 标 右键 单 击 事件 处 理 函 数 
labelDateTime.bind('« Button- 3» ', onRightButtonDown) 
# 显 示 当 前 时 间 的 线程 函数 
de£ nowDateTime () : 

while still.get()- 21: 
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now- datetime.datetime.now() 
s= str (now.year)* '- '4 str (now.month)+ '- '+ str (now.day)+ ' " 
s= s+ str (now.hour)*- ': "+ str (now.minute)^ ':'+ str (now.second) 
# 显 示 当 前 时 间 
labelDateTime['text']- s 
time.sleep(0.2) 

# 创 建 线程 

t= threading.Thread (target- nowDateTime) 

t.daemon- True 

t.start() 


app.mainloop() 


程序 运行 界面 如 图 15-7 所 示 ,电子 时 钟 总 是 在 顶端 显示 ,用 鼠标 左 键 按 住 电子 时 钟 
可 以 拖 动 ,并 且 拖 动 时 窗口 的 透明 度 会 发 生 改变 , 右 击 可 以 关闭 电子 时 钟 程序 。 


= RESTART: C:/Python 3. 5/tkinter_DigitalWatch.pyw == 
= RESTART: E 55 itita atch. pyr = 
= RESTART: C:/Python 3.5/tkinter_DigitalWatch. pyw == 


图 15-7 电子 时 钟 运行 截图 


15.6 简单 动画 


tkinter 的 canvas 对 象 提 供 了 move() 方 法 ,可 以 将 画布 上 的 特定 图 形 沿 着 x 或 y 方 
向 移动 ,利用 这 个 方法 可 以 制作 简单 的 动画 。 
f| 15-6 使 用 tkinter 编写 动画 。 


import tkinter 
import time 


app- tkinter.Tk () 

app.title('tkinter animation') 

app['width']- 800 

app['height']- 600 

canvas- tkinter.Canvas (app, bg- 'white', width- 800, height- 600) 
# 打 开 并 加 载 图 片 

imag tkinter.Photolmage (file- 'yingtaoxiaowanzi.png') 
# 记 下 图 片 的 编号 

id actor= canvas.create image (80，80，image= image) 

# 控 制 是 否 自动 运动 的 变量 

flag- False 

# 单 击 ,角色 自动 运动 


def onLeftButtonDown (event) : 
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glcbal flag 

fla True 

while flag: 
tid actor 表 示 要 运动 的 图 形 编号 
# 第 二 个 参数 表示 x 方向 的 移动 距离 ,5 表示 向 右 移 动 5 个 像素 
# 第 三 个 参数 表示 y 方 向 的 移动 距离 ,0 表示 不 移动 
canvas.move (id actor, 5, 0) 
canvas.update () 
time.sleep(0.05) 

canvas.bind('« Button- 1» ', onLeftButtonDown) 


def onRightButtonUp (event) : 
glcbal flag 
flag- False 
canvas.bind('« ButtonRelease- 3» ', onRightButtonUp) 


# 支 持 使 用 键盘 上 的 4 个 方向 键 来 控制 图 片 的 运动 方向 
def keyControl (event) : 
if event.keysym == 'Up': 
canvas.move(id actor, 0, —5) 
canvas update () 
elif event.keysym == 'Down': 
canvas.move (id actor, 0, 5) 
canvas .update () 
elif event.keysym == 'Ieft': 
canvas.move(id actor, - 5, 0) 
canvas .update () 
elif event.keysym == 'Right': 
canvas.move(id actor, 5, 0) 
canvas .update () 
canvas.bind all('«KeyPress- Up» ', keyControl) 
canvas.bind all('«KeyPress- Down» ', keyControl) 
canvas.bind all('«KeyPress- Left» ', keyControl) 
canvas.bind all('«KeyPress- Right? ', keyControl) 


canvas.pack(fill- tkinter.BOTH, expand- tkinter.YES) 
canvas.focus () 


# 启 动 主 循环 
app-mainlocp() 


运行 程序 以 后 , 单 击 图 片 自动 向 右 移 动 , 右 击 停止 运动 ,通过 键盘 上 的 4 个 方向 键 可 


以 灵活 控制 图 片 的 运动 方向 , 某 个 时 刻 的 图 片 位 置 如 图 15-8 所 示 。 


(QARAR: Python 标准 库 turtle 也 提供 了 很 多 绘图 功能 。 下 面 的 代码 绘制 结果 


如 图 15-9 所 示 。 程 序 运行 后 可 以 看 到 绘图 的 完整 过 程 , 就 是 绘图 比较 慢 ,绘制 复杂 图 形 
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Ô tkinter animation 


15-8 动画 截图 


t.end fill() 


时 需要 有 足够 的 耐心 等 待 画 完 。 
import turtle 
t- turtle.Pen () # 使 用 钢笔 
t.color(1, 0, 0) # 设 置 钢笔 颜色 
t.up() # 抬 起 ,移动 时 不 画 
t.backward (280) # 后 退 26018 XX 
t.left(90) # 左 转 90 
t.forward (100) # 前 进 100 f 3X 
t.right (90) # 右 转 o 
t.down() # 落 笔 , 开 始 画 
for i in range(4): # 绘 制 矩形 
t.forward(150) 
t.left (90) 
t.color(0, 0, 0) 
t.up( 
t.forward (200) 
t.down() 
for i in range(3): # 绘 制 等 边 三 角形 
t.forward (200) 
t.left(120) 
t.upÜ 
t.forward(100) 
t.down() 
t.filloolor(l, 0.6, 0.3) # 设 置 填充 色 
t.begin fil1() 
t.circle (50) # 绘 制 有 填充 色 的 圆 , 半 径 50 像 素 
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t.up() 

t.forward(120) 

t.left(90) 

t.forward (90) 

t.right(90) 

t.down() 

t.width(3) # 设 置 钢笔 粗细 

t.filloolor(0, 0.6, 0.8) # 设 置 填充 色 

t.begin fill() 

fori in range(5): # 绘 制 五 角 星 
t.forward(150) 
t.right (144) 

t.end fi11() 


t.up() 
t.backward (270) 

七 .right (90) 

t. forward (150) 

t.write('Created using turtle, by 董 付 国 ', font (' 素 书 ', 16, "nomral')) 
t.forward(10) 

t.left(90) 

t.width (1) 

t.down() 

t. forward (350) 


4 Python Turtle Graphics. 


Created using turtle，by 董 付 国 


图 15-9 turtle 画图 示例 


15.7 多 窗口 编程 


在 大 型 软件 中 ,不 可 能 所 有 操作 都 在 一 个 窗口 中 实现 ,需要 根据 功能 进行 分 类 并 组 织 
到 不 同 的 窗口 中 实现 ,下 面 的 案例 演示 了 如 何 自 定义 窗口 并 根据 需要 弹出 不 同 的 窗口 。 
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例 15-7 弹出 新 窗口 。 
ámport tkinter 


# 自 定义 窗口 类 
class myWindow: 
# 构 造 函 数 
def init (self, root, myTitle, flag): 
# 创 建 窗口 
self.top= tkinter.Toplevel (root, width= 300, height= 200) 
# 设 置 窗口 标题 
self.tcp.title(myTitle) 
# 设 置顶 端 显示 
self.top.attributes ('- togmost', 1) 
# 根 据 不 同情 况 在 窗口 上 放置 不 同 的 组 件 
if flag--1: 
label= tkinter.label(self.top, text-myTitle) 
label.place (x= 50, y= 50) 
elif flag--2: 
def buttoncK() : 
# 弹 出 消息 提示 框 
tkinter.messagebox. showinfo (title= "Python V5', 
message- 'I am Dong Fuguo') 
button- tkinter.Button (self.top, texte myTitle, ccmmand- buttonOK) 
button.place (x- 50, y= 50) 
# 创 建 应 用 程序 主 窗口 
root= tkinter.Tk() 
# 设 置 主 窗口 大 小 
root.config (width= 400) 
xoot.config (height= 200) 
# 设 置 主 窗口 标题 


windowl- tkinter. IntVar (root, value= 0) 
window2- tkinter. IntVar (root, value= 0) 
# 单 击 按钮 1, 创 建 并 弹出 新 窗口 
def buttonClickl() : 
if windowl.get ()-— 0: 
windowl.set(1) 
wl-myWindow(root, 'First Window', 1) 
buttonl.wait window(wl.top) 
windowl.set (0) 
buttonl- tkinter.Button (root, text= 'First Window', cammend- buttonClickl) 
buttonl.place (-70, y-40, height=40, width= 200) 
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def buttonClick? () : 
if window2.get ()== 0: 


window2.set (1) 
wl-myiWindow(root, 'Second Window', 2) 
button2.wait window(wl.top) 
window2.set (0) 


button2- tkinter.Button (root, text= 'Second Window', camand- buttonClick?) 
button2.place (x= 70, y= 100, height=40, width= 200) 

# 启 动 消息 主 循环 

root.mainloop() 


15.8 屏幕 任意 区 域 截图 


屏幕 截图 是 一 个 很 重要 的 功能 ,键盘 上 的 PrtScn 键 实现 了 全 屏幕 截图 的 功能 , QQ、 
微 信 电脑 版 实现 了 更 加 强大 的 区 域 截图 功能 ,可 以 截取 屏幕 上 任意 区 域 的 图 像 。 一 般 来 


说 ,屏幕 任意 
路 ,使 用 tkin 


区 域 截图 要 依赖 于 Windows API 函数 来 实现 。 但 是 如 果 稍 微 改变 一 下 思 
ter 的 Canvas 对 象 和 Python 扩展 库 pillow 的 ImageGrab 模块 也 可 以 实现 


屏幕 上 任意 区 域 截图 的 功能 。 本 节 案 例 的 基本 思路 是 : 首先 获取 并 显示 全 屏幕 截图 , 然 
后 在 全 屏幕 截图 上 响应 鼠标 左 键 按 下 和 抬 起 事件 ,最 后 进行 二 次 截图 。 


例 15-8 


使 用 tkinter 十 pillow 实现 屏幕 任意 区 域 截图 。 


import tkinter 
import tkinter.filedialog 


inport os 


fram PIL import ImageGrab 


fram time 


import sleep 


root- tkinter.Tk() 
root.geametry ('100X 40+ 400+ 300") 
root.resizable (False, False) 


class MyCapture: 
def init (self, png): 


# 变 量 x 和 Y 用 来 记录 鼠标 左 键 按 下 的 位 置 
self.X- tkinter. IntVar (value= 0) 

self.Y- tkinter.IntVar (value= 0) 

# 屏 幕 尺寸 

ScreenWidth- root.winfo screenwidth() 
ScreenHeight- root.winfo screenheight () 

# 创 建 顶级 组 件 容 器 

# 不 显示 最 大 化 、 最 小 化 按钮 
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self.top.overrideredirect (True) 
self.canvas- tkinter.Canvas (self.top,bg= 'white', width= screerWidth, 
cid Height) 
# 显 示 全 屏 截图 ,在 全 屏 截图 上 进行 区 域 截图 
Self .image= tkinter.Photolmage (file- png) 
self.canvas.create image (screenWidth//2, screenHeight//2, 
image- self.image) 
# 鼠 标 左 键 按 下 的 位 置 
def onLeftButtonDown (event) : 
self.X.set (event .x) 
self.Y.set (event. y) 
# 开 始 截图 
self.sel= True 
self.canvas.bind('« Button- 1» ', onLeftButtonDown) 
# 鼠 标 左 键 移动 ,显示 选取 的 区 域 
def onLeftButtonMove (event) : 
if not self.sel: 
retum 
global lastDraw 
try: 
# 删 除 刚 画 完 的 图 形 , 要 不 然 鼠 标 移动 的 时 候 是 黑 乎 乎 的 一 片 矩形 
self.canvas.delete (lastDraw) 


except Exception as e: 
pass 
lastDraw- self.canvas.create rectangle (self.X.get(), self.Y.get (), event.x, event. y, 
outline- 
'black') 


self.canvas.bind('« Bl- Motion» ', onLeftButtonMove) 
# 获 取 鼠 标 左 键 抬 起 的 位 置 ,保存 区 域 截图 
def onLeftButtonUp (event) : 
self.sel- False 
try: 
Self.canvas.delete (lastDraw) 
exoept Exception as e: 
pass 
sleep(0.1) 
# 考 虑 鼠标 左 键 从 右 下 方 按 下 而 从 左上 方 抬 起 的 截图 
left, right- sorted([self.X.get (), event.x]) 
tap, bottam- sorted([self.Y.get (), event.y]) 
pic- ImegeGrab.grab((left* 1, topt 1, right, bottam)) 
# 弹 出 保存 截图 对 话 框 
fileName- tkinter.filedialog.asksaveasfilename (title= ' 保 存 截图 '，filetypes= [('image 
"jg * .png')]) 
if fileName: 
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pic.save (fileName) 
# 关 闭 当 前 窗口 
self.top.destroy() 
self.canvas.bind('« ButtorRelease- 1» ', onLeftButtorUp) 
self.canvas.pack(fill- tkinter.BOTH, expand- tkinter.YES) 
# 开 始 截 
def buttonCaptureClick() : 
# 最 小 化 主 窗口 
root.state ('icon') 
sleep(0.2) 


filename- 'temp.png' 
im ImageGrab.grab () 
im.save (filename) 
im.close() 
# 显 示 全 屏幕 截图 
w- MyCapture (filename) 
buttonCapture.wait window(w.tcp) 
# 截 图 结束 ,恢复 主 窗口 ,并 删除 临时 的 全 屏幕 截图 文件 
root.state ('normal') 
os.remove (filename) 
buttonCapture- tkinter.Button (root, text= ' 截 图 ', command- buttoenCaptureClick) 
buttonCapture.place (x= 10, y= 10, width= 80, height= 20) 
# 启 动 消息 主 循环 
root.mainlocp() 


15.9 音乐 播放 器 


Python 扩展 库 pygame 提供 了 开发 游戏 所 需要 的 所 有 功能 , 表 15-2 列 出 了 其 中 一 部 
分 。 其 中 ,mixer 模块 提供 了 mp3, wav, ogg 等 格式 音乐 文件 播放 的 功能 ,主要 功能 见 表 
15-3。 另 外 , 跨 平台 音频 /视频 播放 支持 库 Phonon 也 提供 了 播放 音频 和 视频 文件 的 功 
能 ,或 者 也 可 以 使 用 DirectSound 或 WMPlayer. ocx 或 其 他 控件 进行 音乐 文件 播放 。 


表 15-2 pygame 的 主要 模块 


模 块 说 PA 
cursors 控制 鼠标 指针 
display 屏幕 显示 
draw 画图 形 
event 事件 处 理 
font 使 用 字体 
image 图 像 处 理 
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x 
BOX Ho 明 

key 读 取 键 盘 按键 

mask Eri 

math 提供 向 量 类 

mixer 混 音 器 有 关 功 能 

mouse 鼠标 消息 处 理 

movie 视频 文件 播放 ,需要 安装 PyMedia 

scrap 剪贴 板 支持 

surface 绘制 屏幕 

time 时 间 控 制 

transform 修改 和 移动 图 像 

表 15-3 mixer 模块 的 主要 方法 
方 ”法 说 有 明 

pygame. mixer. init() 初始 化 ,必须 最 先 调 用 
pygame. mixer. music. load (filename) 打开 音乐 文件 
pygame. mixer. music. play(count, start) 播放 音乐 文件 
pygame. mixer. music. stop() 停止 播放 
pygame. mixer. music. pause() 暂停 播放 
pygame. mixer. music. unpause() 继续 播放 
pygame. mixer. music. get_busy() 检测 声卡 是 否 正 被 占用 


例 15-9 使 用 pygame 十 threading 编写 音乐 播放 器 。 


inport os 
import tkinter 


import tkinter.filedialog 


import randcm 
import time 
import threading 
inport pyme 


folder- '' 


def Play(): 


# 默 认 播放 D:\music 文 件 夹 中 的 所 有 mp3 文 件 


glcbal folder 
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musics- [foldert 'NV -music for misic in os.listdir(folder)V 
if music.endswith ((' mp3", '.wav', '.ogg'))] 
total- len (msics) 
# 初 始 化 混 音 器 设备 
pygame -mixer.init () 
while playing: 
if not pygame.mixer.music.get busy(): 
# 随 机 播放 一 首 歌曲 
nextMisic- randan.choice (musics) 
Pygame .mixer .music. load (nextMisic.encode () ) 
播放 一 次 
Pygame .mixer .misic.play (1) 
msicName.set ('playing-* '+ nextMisic) 
else: 
time.sleep(0.3) 


root- tkinter.Tk() 
root.title(' 音 乐 播放 器 v1.0- - SC (E ES ") 
root.geametry ('280x70* 400+ 300") 
root.resizable (False, False) 


# 关 闭 程序 时 执行 的 代码 
def closeWindow(): 
glcbal playing 
playing- False 
try: 
pygame mixer .msic.stop() 
Pygame mixer .quit () 
except: 
pass 
root.destroy () 
root.protocol('WM DELETE WINDOW', closeWindow) 


pause resume- tkinter.StringVar (root, value- 'NotSet') 
playing- False 


# 播 放 按钮 
def buttonPlayClick() : 
glcbal folder 
if not folder: 
folder- tkinter.filedialog.askdirectory () 
if not folder: 
retum 
glcbal playing 
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playing-True 
# 创 建 一 个 线程 来 播放 音乐 
t= threading. Thread (target- play) 
t.start() 
# 根 据 情 况 禁 用 和 启用 相应 的 按钮 
buttonPlay['state']- 'disabled' 
buttonStop['state']- 'normal' 
LbuttonPause|['state']- "normal" 
buttonNext ['state']- 'normal' 
pause resume.set ('Pause') 
buttonPlay- tkinter.Button (root, text= 'Play', comand buttonPlayClick) 
buttonPlay.place (x= 20, y= 10, width= 50, height= 20) 


# 停 止 按钮 
def buttonStepClick() : 
glcbal playing 
playing- False 
pygame mixer misic.stop () 
musicName.set(" 暂 时 没有 播放 音乐 ) 
buttonPlay['state']- "nommal' 
buttonstop['state']= 'disabled' 
buttonPause['state']= 'disabled' 
buttonStop= tkinter.Button (root, text= 'Stop', command buttonStopClick) 
buttonStcp.place (x= 80, y= 10, width= 50, height= 20) 
buttonstop['state']= 'disabled' 


# 暂 停 与 恢复 ,两 个 功能 共用 一 个 按钮 
def buttonPauseClick() : 
glcbal playing 
if pause resume.get ()- — 'Pause': 
#playing= False 
pygame.mixer.misic.pause () 
pause resume.set ('Resume') 
elif pause resume.get ()- — 'Resure' : 
fplaying- True 
pygame.mixer.misic.unpause () 
pause resume.set ('Pause') 
buttonPause- tkinter.Buttcn (root, textvariable- pause resume, V 
command buttenPauseClick) 
LbuttonPause.place (x= 140, y= 10, width= 50, height= 20) 
dbuttonPause|['state' ]- 'disabled" 


# 下 一 首 音乐 
def buttonNextClick() : 
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glcbal playing 
playing- False 
pygame.mixer.misic.stop() 
pygame mixer.quit () 
buttonPlayClick() 
buttonNext- tkinter.Button (root, text= 'Next', command buttonNextClick) 
buttonNext.place (x= 200, y= 10, width- 50, height= 20) 
buttonNext ['state']- 'disabled' 


musicName- tkinter.StringVar (root, value= ' 暂 时 没有 播放 音乐 … ') 
labelName- tkinter.Label(root, textvariable- musicName) 
labelName.place (x- 0, y= 40, width=270, height= 20) 


# 启 动 消息 循环 
root.mainloop() 


这 款 小 软件 的 运行 界面 如 图 15-10 所 示 。 


(ssmsmaoo-mem [o] 0E] 
Pay | _stop | Pause] Ne« | 


playing: D:/music lé. mp3 


图 15-10 MP3 播放 器 界面 


15.10 ”远程 桌面 监控 系统 


现在 几乎 所 有 学 校 机 房 都 安装 了 远程 监控 软件 ,可 以 在 主 控 机 或 教师 机 上 实时 查看 
学 生 端 屏幕 ,如 果 发 现 有 同学 在 做 与 学 习 无 关 的 事情 还 可 以 远程 关机 ,有 力 震 慑 了 上 机 课 
玩 游戏 或 者 网 购 的 同学 ,提高 了 教学 质量 (最 起 码 理论 上 是 这 样 的 ,但 是 也 有 同学 退出 了 
机 房管 理 软件 的 客户 端 ,就 没 法 管理 了 ,这 属于 另 一 个 问题 ,不 在 本 书 讨论 范围 之 内 ) 。 下 
面 的 代码 实现 了 远程 桌面 监控 功能 .可 以 实时 截取 远程 计算 机 的 桌面 并 传送 到 监控 端 进 
行 显 示 。 

例 15-10 使 用 tkinter 十 pillow 十 socket 编写 远程 桌面 监控 软件 。 

(1) 监控 端 代码 (tkinter_RemoteDesktopMonitor_Server. pyw) : 

import tkinter 

import socket 

import time 

import threading 

import struct 

fron PTL import Image, ImegeTk 


def updateCanvas (canvas) : 


$ 15€ tkinter 编程 精彩 案例 E 463 
e 


glcbal imageId 
socke socket.socket(socket.AF INET, socket.SOCK STREAM) 
sock.bind(('', 10600)) 


sock.listen(l) 
while ruming.get ()==1: 
# 自 适应 当前 监控 窗口 大 小 


width= canvas.winfo width() 
height= canvas.winfo height () 
conn, addr- sock.acospt () 
tenpImageBytes- b' " 
# 图 像 字 节 数量 
len head struct.calcsize('1128s1') 
data= conn.recv (len head) 
length, size ,sizelength- struct.unpack (' T1281 ' , data) 
length- int (length) 
rest- length 
bufferSize- 1024* 10 
size- eval (size[:int (sizelength)]) 
while running.get ()- — 1: 
if rest» bufferSize: 
data= conn. recv (1024 * 10) 
else: 
data- conn.recv (rest) 
templImageBytes += data 
rest- rest- len (data) 


# 远 程 桌面 截图 接收 完成 ,显示 图 像 
if rest ==0: 
tempImage- Image. franibytes ('FGB', size, templmageBytes) 
tempImage- templmage. resize ( (width, height)) 
dtenpIInege. save ("temp.png*) 
tempImage- ImageTk.FhotoImage (tempImage) 
# 清 除 上 一 个 截图 
try: 
canvas.delete (imageId) 
except: 
pass 
imegeld carvas.create ime (width//2, height//2, imege- teple) 
scanvas.update () 
# 通 知客 户 端 可 以 发 送 下 一 个 截图 
conn.send (b'ok') 
print (*ok*) 
break 
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conn.close() 


root- tkinter.Tk () 

# 主 程序 窗口 位 置 和 大 小 

root.geametry (' 640 480+ 400+ 300") 

width= 640 

height= 480 

root.title(' 远 程 桌面 监考 系统 v1.0- - — CREER ") 


# 用 来 表示 监控 软件 是 否 运 行 的 变量 
running- tkinter. IntVar (root, 1) 


# 关 闭 监 控 窗口 时 触发 的 消息 处 理 代码 
def closeWindow () : 

running.set (0) 

root..destroy () 
root.protocol('WM DELETE WINDOW', closeWindow) 


canvas- tkinter.Canvas (root, width= width, height- height) 
canvas.pack (fill- tkinter.BOTH, expand tkinter.YES) 

# 使 用 子 线程 刷新 监控 窗口 

t= threading.Thread(target- updateCanvas, args- (canvas,)) 
# 主 线程 关闭 时 强制 关闭 刷新 窗口 的 子 线程 

t.daemon- True 

七 .start () 

root.mainloop() 

(2) 被 监控 端 代码 (tkinter_RemoteDesktopMonitor_Client. pyw) : 
import socket 

import struct 

fram time import sleep 

fram PIL import ImageGrab 


while True: 
try: 
sock- socket.socket(socket.AF INET, socket.SOCK STREAM) 
# 假 设 监控 端 主机 rp hb y 10.2.1.2,Jf ME Jr 1060035 O 
sock.connect ((10.2.1.2', 10600) 
# 本 地 全 屏幕 截图 
im- ImageGrab.grab() 
size= im.size 
# 发 本 地 截图 转换 为 字 节 串 进行 发 送 
imegeBytes- im.tcbytes () 
# 发 送 字 节 串 总 长 度 和 图 像 大 小 
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fhead struct.pack ('I128s1', len (imsgeBytes), str (size) „encode (), 
len(str (size) .encode ())) 
Sock.send (fhead) 
rest- len (imageBytes) 
bufferSize- 1024* 10 
while True: 
if rest» bufferSize: 
temp imegeBytes [:bufferSize] 
imageBytesr imageBytes [pufferSize:] 
else: 
tempr imegeBytes[:] 
Sock.send(temp) 
rest- rest- len (terp) 
# 本 次 截图 发 送 完成 
if rest ==0: 
if sock.recv (100)- —- b'ok': 
print ('ok') 
break 
sock.close() 
exoept: 
print(' 无 法 连接 监控 端 ') 
(QARAR: 对 于 例 15-10 的 程序 有 几 点 需要 补充 说 明 一 下 : 四 通过 socket 进行 
网 络 通信 时 收发 数据 包 的 数量 和 大 小 最 好 是 一 致 的 ,要 不 然 会 导致 混乱 而 无 法 正常 监控 ; 
加 如 果 需 要 进行 屏幕 广播 ,需要 使 用 UDP, 可 以 参考 本 书 第 16 章 介绍 的 服务 器 发 现 功能 
代码 ; 回 在 上 面 程序 的 实现 中 ,发 送 端 把 屏幕 截图 转换 为 字 节 囊 后 发 送 给 接收 端 ,而 接收 
端 接收 完整 个 屏幕 截图 后 还 原 为 图 像 进行 显示 ,这 些 操作 都 是 在 内 存 中 进行 的 ,如 果 同 时 
监控 多 个 客户 端 ,可 能 会 占用 监控 端 大 量 的 内 存 ,可 以 接收 藏 图 的 内 容 后 不 存储 在 内 存 中 
而 是 写 入 磁盘 文件 来 缓解 监控 端的 内 存 压力 ; 四 每 次 收发 数据 包 的 大 小 不 能 太 大 或 太 
小 ,如 果 太 大 可 能 会 因为 出 错 引起 的 频繁 重 传 而 降低 效率 ,如 果 太 小 则 会 因为 额外 开销 
(在 网 络 体系 结构 中 ,发 送 端 数据 包 每 往 下 一 层 就 会 加 一 层 * 皮 ”, 而 接收 端 每 往 上 一 层 就 
会 为 数据 包 去 掉 一 层 “ 皮 ”, 这 些 “ 皮 ”是 有 开销 的 ) 太 大 而 降低 效率 。 


管理 系统 设计 与 实现 


目前 越 来 越 多 的 学 校对 程序 设计 类 课程 采取 了 边 讲 边 练 的 授课 方式 , 比 传统 的 “课堂 
授课 十 实验 ”的 教学 模式 具有 更 好 的 教学 效果 。 本 章 设计 的 “ 边 讲 边 练 类 课堂 教学 管理 系 
统 " 实 现 了 在 线 点 名 、 交 作业 ,在 线 答疑 ,自我 测试 .在线 考试 等 功能 ,更 大 程度 地 提高 了 课 
堂 时 间 利 用 率 , 有 效 保证 了 教学 进度 。 从 技术 角度 来 讲 , 除 了 Python 基础 语法 和 基本 类 
型 之 外 ,还 涉及 文件 操作 ,数据 库 操 作 、 多 线程 编程 .GUI 编程 .正则 表达 式 等 。 


16.1 功能 简介 


1611 教师 端 功能 
教师 端 或 服务 端 是 整个 系统 的 核心 , 主 界面 如 图 16-1 所 示 ,主要 提供 了 以 下 功能 。 


图 16-1 教师 端 主 界面 


CD 信息 导入 : 包括 学 生 名 单 和 题库 的 导入 ,其 中 学 生 名 单 支持 xls 文件 格式 ,而 题 
库 导 入 支持 xlsx 和 docx 两 种 文件 格式 。 

(2) 在 线 点 名 与 离线 点 名 : 由 任课 教师 控制 点 名 时 间 段 ,学 生 在 学 生 端 输入 学 号 和 
姓名 进行 在 线 点 名 , 几 百 人 可 以 瞬间 完成 点 名 ,大 幅度 提高 了 课堂 时 间 的 利用 率 ,并 且 可 
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以 有 效 防 止 有 人 蔡 同 学 答 到 ;离线 点 名 可 以 根据 情况 用 来 为 迟到 或 请 假 的 同学 补 点 名 。 

(3) 随机 提问 : 教师 选择 专业 后 由 系统 随机 分 配 一 个 学 生 进 行 提问 ,学 生 回答 结束 
后 可 以 在 系统 中 记录 答题 情况 与 得 分 。 

(4) 加 分 与 减 分 : 可 以 为 认真 听课 并 且 作业 完成 特别 好 的 同学 额外 加 分 ,给 不 认真 
听课 的 学 生 减 分 。 

(5) 在 线 收 作业 : 系统 可 以 接收 学 生 端 计算 机 全 屏幕 截图 作为 作业 ,适合 检查 学 生 
随 堂 练习 或 者 小 段 代 码 的 作业 的 完成 情况 ;也 可 以 接收 学 生 端 上 传 的 Python 程序 文件 
或 rar/zip 压缩 文件 作为 作业 ,适合 需要 较 多 代码 的 作业 。 由 教师 控制 交 作 业 时 间 段 ,可 
以 有 效 利用 课堂 的 宝贵 时 间 , 还 可 以 保证 教学 进度 ,并 且 在 有 限 的 时 间 内 激发 学 生 潜能 。 

(6) 在 线 答疑 ; 学 生 在 线 提出 疑问 ,教师 及 时 解答 ,而 对 于 提问 较 多 的 问题 ,可 以 再 
对 所 有 同学 重点 讲 一 下 ,不 用 一 一 解答 ,可 以 节省 宝贵 时 间 。 

(7) 在 线 测试 与 考试 学 生 可 以 在 老师 允许 的 时 间 段 内 查看 系统 中 提供 的 练习 题 ， 
并 且 可 以 查看 标准 答案 ;在 线 考试 功能 可 以 用 来 完成 单元 测试 .期 中 考试 或 者 期 末 考 试 ， 
由 老师 控制 考试 时 间 段 ,由 系统 为 每 个 学 生 随机 分 配 题目 ,座位 相 邻 的 学 生 在 同一 时 间 很 
难 分 配 到 同一 道 题 ,使 得 作 整 的 可 能 性 几乎 为 0。 另 外 ,考试 模式 下 禁用 学 生 端的 主流 文 
本 编辑 器 和 浏览 器 ,进一步 降低 作 员 的 可 能 。 

O 信息 查看 : 可 以 在 线 查 看 学 生 名 单 . 出 勤 情况 .提问 情况 .考试 情况 等 各 类 信息 。 

(9) 数据 导出 : 这 个 功能 用 来 把 系统 中 的 学 生 点 名 、 随 机 提问 、 在 线 答疑 ,考试 成 绩 
等 各 类 数据 导出 到 xlsx 文件 ,可 以 实现 离线 数据 查看 。 

1612 学 生 端 功能 

学 生 端 主要 实现 在 线 点 名 、 交 作业 、 在 线 提问 以 及 在 线 自 测 和 考试 等 功能 , 主 界面 如 
ice Vea a ET 

(D 报到 : 输入 学 号 和 姓名 之 后 , 单 击 “ 报 到 " 按 yo， 一 一 
钮 可 以 进行 在 线 点 名 ,系统 根据 已 导入 的 学 生 和 名 单 | ree 
来 识别 学 号 和 姓名 是 否 正确 。 Bamet: [1921680103 x-» 

(2) 提 问 : 单 击 “ 提 问 ” 按 钮 后 弹出 新 窗口 ,输入 E ale 
完整 问题 后 发 送 给 教师 端 ,任课 教师 看 到 后 及 时 po | ea mel 
解答 。 图 16-2 学 生 端 主 界面 

(3) 交 作业 : 可 以 根据 老师 的 作业 要 求 选择 “全 
屏幕 截 图 交 作业 ”或 者 “上传 文件 交 作 业 ”。 

(4) 在 线 自 测 与 考试 : 单 击 “自我 测试 "或 “考试 "按钮 ,弹出 新 窗口 查看 题库 中 的 题 
目 。 自 我 测试 时 题目 按 题库 中 的 顺序 依次 出 现 ,并 且 可 以 查看 每 道 题 的 答案 ;而 考试 时 题 
目 随机 出 现 ,并 且 不 允许 查看 答案 , 答 完 100 道 题 之 后 系统 自动 进行 评分 ,考生 可 以 立刻 
得 知 自己 的 分 数 (对 于 没 好 好 学 习 的 学 生 好 像 是 有 点 残忍 )。 


3 Python 可 以 这 样 学 


16.2 数据 库 设 计 


系统 采用 了 Python PIS SQLite 数据 库 ,所 用 到 的 表 结 构 如 表 16-1 所 示 。 


表 16-1 RAH 
数据 表 字 段 字段 类 型 
kecheng TEXT 
EEA xuehao TEXT 
xingming TEXT 
zhuanye TEXT 
id INTEGER PRIMARY KEY 
kechengmingcheng TEXT 
tiku zhangjie TEXT 
timu TEXT 
daan TEXT 
diig xuehao TEXT 
shijian TEXT 
xuehao TEXT 
tiwen shijian TEXT 
defen NUMERIC 
xuehao TEXT 
xueshengtiwen wenti TEXT 
shijian TEXT 
xuehao TEXT 
tikufangwengingkuang xingming TEXT 
shijian TEXT 
id INTEGER PRIMARY KEY 
xuehao TEXT 
xingming TEXT 
shijian TEXT 
kaoshi 
timubianhao NUMERIC 
xueshengdaan TEXT 
biaozhundaan TEXT 
shifouzhengque TEXT 
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16.3 系统 总 框架 与 通用 功能 设计 


(1) 导入 系统 功能 所 需要 的 Python 标准 库 和 扩展 库 ,并 根据 需要 及 时 升级 pip 
工具 : 

import datetime 

inport tkinter 

import tkinter.filedialog 

import socket 

import sqlite3 

import randcm 

import threading 

import time 

import struct 

import os 

import sys 

inport string 


# 先 把 pip 升 级 到 最 新 版 本 
path= '"'+ os.path.di name (sys.executable)4 V 
'\\scripts\\pip" install - - upgrade pip' 
os.system (path) 
# 导 人 必要 的 扩展 库 
#docx 扩 展 库 
try: 
import docx 
except: 
path= '"'+ os.path.dirname (sys.executable)4 V 
"\\scripts\ pip" install python- docx' 
os.system(path) 
import docx 
#xlrd 扩 展 库 
try: 
import xlrd 
except: 
Path= '"'+ os.path.dimame (sys.executable)+ '\\scripts\ \pip" install xlrd' 
os.system (path) 
import xlrd 
topa 扩展 库 
try: 
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import openpyxl 
exoept: 
path= '"'+ os.path.dirname (sys.executable)4 V 
"NNscriptsWpip" install cpenpyxl' 
os.system (path) 
import openpyxl 
(2) 创建 tkinter 应 用 程序 主 窗口 ,并 自 定义 关闭 窗口 的 事件 处 理 函 数 : 


root- tkinter.Tk() 
# 定 义 窗 口 大 小 
#root.config (width= 360) 
#root.config (height= 260) 
root.geametry ("360X 340+ 400+ 300") 
# 不 允许 改变 窗口 大 小 
root.resizable (False, False) 
root.title(' 边 讲 边 练 类 课程 教学 管理 系统 中 .0- - - 董 付 国 ) 
# 关 闭 程序 时 ,取消 点 名 、 收 作业 、 接 受 提问 以 及 接受 客户 端 查询 等 状态 
# 和 避免 端 口 一 直 占 用 
def closeWindow(): 
# 结 束 点 名 
if int_canDiaming.get ()==1: 
int_canDiarming.set (0) 
# 结 束 收 作业 
if int zuoye.get ()==1: 
int zuoye.set(0) 
# 结 束 学 生 主动 提问 
if int_xueshengTiwen.get ()== 1: 
int xueshengTiwen.set (0) 
# 结 束 服务 状态 
if int server.get()--1: 
int server.set (0) 
root.destroy () 
HABE SET AXE DR C 
root.protocol("WM DELETE WINDOW', closeWindow) 


(3) 定义 一 个 通用 类 ,封装 系统 中 频繁 使 用 的 功能 : 
# 通 用 功能 类 


class Camon: 
# 查 询 数据 库 ,获取 学 生 专 业 列表 
def getzhuanye() : 
connr sqlite3.connect ('database.db') 
cur= conn.cursor () 
cur.execute ("SELECT distinct (zhuanye) FROM students!) 
temp= cur. fetchall () 
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conn.close() 

xueshengzhuanye- [] 

for line in temp: 
xueshengzhuanye append (Line [0]) 

return xueshengZhuanye 


# 获 取 指定 专业 的 学 生 名 单 
de£ getXuehacXingning (zhuanye) : 
conn= sqlite3.connect ('database.db") 
cur- conn.cursor () 
cur.execute ("SELECT xuehao,xingning FROM students WHERE zhuanye- '"+ zhuanyet "' ORDER BY 
xuehao") 
temp- cur.fetchall () 
conn.close () 
xueshengxinxi- [] 
for line in temp: 
xueshengXinxi .append (Line[0]* ', '+ line[1]) 
return xueshengXinxi 


# 获 取 指定 学 号 的 出 勤 次 数 

def getChuginCishu (xuehao) : 
conn= sqlite3.connect ('database.db') 
cur- conn.cursor () 
cur.execute ("SELECT count (xuehao) FRM dianming WHERE xuehao- '"* xuehao 

pum) 
temp= cur. fetchall () 
conn.close() 
xueshengxinxi- [] 
for line in temp: 
xueshengXinxi append (Line [0] 

return xueshengXinxi 


# 获 取 指 定 学 号 的 学 生 提 问 总 得 分 

def getTiwenDefen (xuehao) : 
conre sqlite3.connect ('database.db') 
cur- oonn.cursor () 
cur.execute ("SELECT sum(defen) FRM tiwen WHERE xuehao- '"+ xuehaot "'") 
tenp- cur.fetchall() 
conn.close() 
xueshengXinxi- [] 
for line in temp: 

xueshengXinxi .append (Line [0]) 

return xueshengxinxi 
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# 获 取 指 定 学 号 的 学 生 主动 提问 次 数 
def getZhudongTiwenCi shu (xuehao) : 
conn= sql ite3.ocnnect ('database.do') 
cur- conn.cursor () 
cur.execute ("SELECT oount (xuehao) FROM xueshengtiwen WHERE xuehao- '"+ xuehaot "' AND wenti 
NOT LIKE "E [n] S7 n) 
temp- cur.fetchall() 
conn.close() 
xueshengxinxi- [] 
for line in temp: 
xueshengxinxi append (Line [0] ) 
return xueshengXinxi 


# 查 看 学 生 在 线 考试 得 分 

def getKaoshiDefen (xuehao) : 
conn- sqlite3.connect ('database.db') 
cur- conn.cursor () 
cur.execute ("SELECT count (xuehao) FROM kaoshi WHERE xuehao- '"+ xuehaot 

"' AND shifouzhengque- 'Y'") 
temp- cur. fetchall () 
conn.close() 
xueshengkaoshi- [] 
for line in temp: 
xueshengkaoshi .append (line [0] ) 

return xueshengkaoshi 


# 获 取 指定 SQL 语句 查询 结果 
def getDataBYSQL (sql) : 
conn= sqlite3.connect ('database.db') 
cur- oonn.cursor () 
cur.execute (sql) 
result- cur.fetchall() 
conn.close 


return result 


AG socii] 
def doSQL (sql) : 
conn- salite3.connect ('database.db') 
cur- conn.cursor () 
cur.execute (sql) 
conn.coammit () 


comn.close () 


# 当 前 日 期 时 间 ,格式 为 咋 -月 -日 时 :分 : 秒 " 
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def getCurrentDateTime () : 
retum str (datetime.datetime.now()) [:19] 


# 当 前 日 期 时 间 之 前 一 个 半 小 时 前 的 时 间 , 主 要 用 来 避免 重复 点 名 
df getStartDateTime () : 

now- datetime.datetime.now() 

now- nowt datetime.timedelta (minutes- - 90) 

return str (now) [:19] 


16.4 数据 导入 功能 


1641 学 生 名 单 导 入 


系统 支持 把 Excel 文件 中 的 学 生 名 单 导入 数据 库 中 ,主要 代码 如 下 : 


# 导 人 学 生 信息 
def buttonInportXueshengXinxiClick() : 
filename- tkinter.filedialog.askopenfilename (title= "请 选择 Excel 文件 
filetypes- [ (Excel Files','* .xls')]) 
if filename: 
# 读 取 数 据 并 导 和 人 数据库 
workbook- xlrd.open workbook (filename= filename) 
sheetl-workbook.sheet by index(0) 
Excel 文件 必须 包含 431] ,分 别 为 学 号 ,姓名 ,专业 年 级 .课程 名 称 
if sheet1.ncols !=4: 
tkinter.messagebox. showerror (title= "I B ', 
message- 'Exoel 文件 格式 不 对 ') 
retum 
for rowIndex in range(l, sheetl.nrows) BB Jj Excel 文 件 每 一 行 
row- sheetl.row(rowIndex) 
sql= "INSERT INTO students (xuehao, xingming, zhuanye, kecheng) VALUES ('"+ str (row [0]. 
value) .strip()* "', "+ str (row[1] value) * "', '"+ str (row[2] . value) * "', "+ str (row [3]. 
value) "')" 
Ganmon.doSQL (sql) 
tkinter.messagebox. showinfo (title= 'A& Ef ', message- ' 导 人 成 功 ') 
# 创 建 按钮 并 放置 到 主 窗 口上 
buttonImportXueshengxinxi= tkinter.Button (root, text= ' 导 人 学 生 信息 '， 
buttonImportXueshengxinxi .place (x= 20, y= 20, height=30, width= 100) 


1642 题库 导入 
题库 导入 功能 支持 xls 和 docx 两 种 格式 的 文件 ,可 以 读 取 题 库 内 容 并 自动 判断 
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def buttorDaoruTikuClick() : 
filename- tkinter.filedialog.askcpenfilename (title= "请 选择 Excel 2003 sk, Word 2007 版 本 的 题库 
文件 '， filetypes- [ ("Excel Files','* .xls'), ("Word 2007 Files','* .docx')]) 
if filename: 
# 读 取 数据 并 导 人 数据库 
#Excel 文件 
if filename.endswith (' x15") : 
workbook- xlrd.open workbook (filename- filename) 
sheetl-workbook.sheet by index(0) 
Excel 文件 必须 包含 4 31] ,分 别 为 课程 名 称 ,章节 ,题目 .答案 
if sheetl.nools !=4: 
tkinter.messacebax. showerror (title= "füldk ', message 题库 格式 不 对 ') 
retum 
for rowIndex in range(l, sheetl.nrows) :# 遍 历 Excel 文件 每 一 行 
row sheetl.row (rowIndex) 
sql= "INSERT INIO tiku (kechengningcheng, zhangjie, timi, daan) VALLES ('"+ str (row[0] . 
value) .strip()+ "', '" str (row[1] .value)+ "', '"+ str (row[2] value) + "', '"+ str (row 
[3] .value)+ "')" 
Common.doSsoL (sql) 
tkinter.messagebox.showinfo (title= "恭喜 message- ' 导 人 成功 ') 
#docx 文 件 
elif filename.endswith (' .docx") : 
#abcx 文 档 题库 包含 很 多 段 ,每 段 一 个 题目 
#datase.db 中 tilm 表 包含 kechengningcheng, zhangjie, timu, daan 四 个 字段 
fram docx import Document 
doc- Document (filename) 
# 连 接 数据 库 
conne sqlite3.connect ('database.db') 
cur- conn.cursor () 
# 先 清空 原来 的 题 , 可 选 操作 
cur.execute ('delete from tiku') 


conn.canmit () 


for p in doc.paragrachs: 

text-p.text 

if '('intext and ')' in text: 
index- text.index(' (') 
# 分 离 问题 和 答案 
question- text [:index] 
if' — 'inquestion: 

question- "填空 题 :'+ question 

else: 
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question- "Fl IB :'+ question 
answer- text [indext 1:- 1] 
# 将 数据 写 人 数据库 
sql= 'INSERT INTO tiku (kechengningcheng, zhangjie, tim, daan) VALUES ("Python 程 
序 设计 "," 未 分 类 ","'+ questiont ', "+ answer '")' 
cur.execute (sql) 
conn.camit () 
# 关 闭 数据 库 连接 
conn.close() 
tkinter.messagebox. showinfo (title= "恭喜 message- ' 导 人 成 功 ') 
buttonDaoruTiku- tkinter.Button (root, text= ' 导 人 题库 ',， command- buttonDsonuTikuclick) 
buttonDeorufiku.place (x-20, y= 220, height= 30, width= 100) 


16.5 点 名 与 加 分 功能 


1651 在 线 点 名 


在 线 点 名 功能 使 用 多 线程 技术 实现 ,通过 主 窗口 上 的 按钮 来 启动 和 停止 负责 点 名 的 
线程 。 学 生 端 输入 学 号 和 姓名 并 单 击 “ 报 到 ”按钮 之 后 ,系统 首先 判断 学 号 和 姓名 是 否 与 
已 导入 的 学 生 名 单 匹配 ,并 且 检 测 是 否 为 重复 点 名 ,如 果 是 正常 点 名 则 把 学 号 和 点 名 时 间 
插入 数据 库 。 另 外 ,系统 还 对 学 生 端的 IP 地址 进行 识别 和 记录 ,限制 每 台 计 算 机 只 能 一 
个 学 生 点 名 ,有 效 防止 了 有 同学 代替 别人 签名 报到 的 情况 。 

服务 端 主要 代码 如 下 : 


# 控 制 是 否 可 以 点 名 的 变量 ,1 表示 可 以 ,0 表示 不 可 以 
int canDianmming- tkinter.IntVar (root, value= 0) 
def thread Diarming(): 
# 开 始 监听 
glcbal sockDianming 
sockDiamming- socket.socket(socket.AF INET，socket.SOCK_STRERM) 
sockDianming.bind(('', 30000)) 
sockDiarming. listen (200) 
while int canDiarming.get ()- — 1: 
try: 
# 接 受 一 个 客户 端 连接 
conn, addr= sockDiarming.acoept () 
except: 
retum 
data= conn.recv (1024) 
data= data.decode () 
# 客 户 端 发 来 的 消息 格式 为 "学 号 ,姓名 " 
xuehao, xingming- data.split(', ') 
# 首 先 检 查 学 号 与 姓名 是 否 匹 配 ,并 且 与 数据 库 中 的 学 生 信息 一 致 
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sqlIfMstch- "SELECT count (xuehao) FROM students WHERE xuehao- '"+ 
xuehaot "' AND xingning- '"+ xingmingt mm 
if Coamen.getDataBySQL (sql TfMatch) [0] [0] (=1: 
conn. sendall ('notmatch' .encode () ) 
conn.close() 
else: 
# 记 录 该 学 生 点 名 信息 :学 号 、 姓 名、 时间 
# 并 反馈 给 客户 端点 名 成 功 ,然后 客户 端 关 闭 连接 
currentTime- Commpn.getCurrentDateTime () 
# 获 取 一 个 半 小 时 之 前 的 时 间 
startTime- Common.getStartDaterTime () 
4 查看 是 否 已 经 点 名 过 ,各 免 一 个 半 小 时 内 重复 点 名 
sqlShifouchongfuDianmingr "SELECT count (xuehao) FROM dianming WHERE xuehao- "+ xuehaot " 
' AND shijian >= "+ startTimet "'" 
if Coamn.getDataBySQL (sqlShi fouchongfuDiarming) [0] [0]. != 0: 
conn.sendall ('repeat' .enoode () ) 
conn.close() 
else: 
# 检 查 是 否 代替 点 名 ,根据 学 生 端 Te dO RE VUD 
sqlshifoupaiDianmingF "SELECT count (ip) FROM diarming WHERE ip- '"+ addr [0]+"" AND 
shijian >= "4 startTimet "'" 
if Cammon.getDataBySQL (sqlShi fouDaiDiarming) [0] [0] !— 0: 
conn.sendall ('daidiarming' .enoode () ) 
conn.close() 
else: 
# 点 名 
sqlDianming= "INSERT INTO diarming (xuchao, shijian, ip) VALUES ('"+ xuehaot "', '" 
+ currentTime* "', '" addr [0]+ "")" 
Common .doSQL (sqlDiarming) 
conn. sendall ('ok' .encode ()) 
conn.close() 
sockDiarming.close() 
sockDiarming- None 
学 生 端 代码 相对 简单 ,获取 学 生 输入 的 姓名 和 学 号 ,连接 服务 器 ,通过 Socket 把 信息 
发 送 到 教师 端 ,然后 根据 教师 端的 反馈 进行 相应 的 提示 。 核 心 代码 如 下 : 


# 登 录 按钮 事件 处 理 函 数 
def buttoncKClick(): 
# 获 取 学 号 和 姓名 
xuehao- entryXuehao.get () 
xingming- entryXingming.get () 
serverIP- entryServerIP.get () 
if not re.match ('^Nd(1, 3 -Nd(1, 3A -Nd(1,3 -\d{1,3}$ ', serverTP) : 
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tkinter.messagebox.showerror ("B JL EC", HR Ar 38 全 地 址 不 合法 ') 
retum 
# 创 建 socket, 并 连接 教师 端 
sock-socket.socket(socket.AF INET, socket.SOCK STREAM) 
try: 
sock.connect ((serverIP, 30300)) 
except Exception as e: 
tkinter.messagebox. showerror ("f fü Bk ', SAUfE A J& jx A IS [a] ") 
retum 
# 向 教师 端 发 送 学 号 和 姓名 ,然后 等 待 教师 端 反 馈 信息 
Sock.sendall ( (xuehaot ', "+ xingming) .encode () ) 
data- sock.recv (1024) 
data= data.decode () 
# 根 据 教 师 端的 反馈 信息 进行 相应 的 提示 
if data.lower()== 'ok': 
# 点 名 成 功 
tkinter.messageboa. showinfo('A ff ', xuehaot ,+xingmingt ' 报到 点 名 成 功 ') 
sock.close() 
retum 
elif data.lower ()== 'repeat': 
tkinter.messagebox. showerror ("IR fü Bk ', As fer SERI ") 
sock.close() 
retum 
elif data.lower()- — 'notmatch': 
tkinter.messagebox. showerror (RHR '，" 学 号 与 姓名 不 匹配 ') 
sock.close() 
retum 
elif data.lower()- — 'daidiarming' : 
tkinter.messagebox. showerror (RHR '，' 不 允许 替 别人 点 名 ,警告 一 次 
sock.close() 
return 
# 在 学 生 端 应 用 程序 主 界面 上 创建 按钮 并 设置 单 击 事件 处 理 函 数 
buttonok= tkinter.Button (root, text= "报到 '，command= buttoncKClick) 
buttonOk.place (x-30, y= 90, width= 80, height= 20) 


1652 离线 点 名 与 加 分 


离线 点 名 功能 主要 用 来 给 迟到 或 请 假 的 同学 点 名 ,加 分 功能 用 来 为 上 课时 听课 非常 
认真 的 同学 进行 加 分 , 减 分 功能 用 来 为 上 课时 听课 非常 不 认真 的 同学 进行 减 分 ,这 3 个 功 
能 由 教师 在 软件 教师 端 操作 完成 ,如 图 16-3 所 示 。 该 窗口 主要 代码 如 下 : 

class windowChakanXueshengXinxi : 


def init (self, root, myTitle): 
self.top- tkinter.'Toplevel (root, width= 350, height= 400) 
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self.tcp.title(myTitle) 
Self.tcp.attributes ('- topmost 1) 


# 用 组 合 框 来 显示 学 生 的 专业 
# 调 用 通用 功能 类 中 的 方法 获取 学 生 的 专业 
xueshengZhuanye- Camon.getZhvanye () 
conibaboxZhuanye- tkinter.ttk.Cambobox (sel f.top, values- 
xueshengZhuanye) 
carbcboxZhuanye.place (x= 20, y= 20, height=20, width= 100) 
def buttonchakanClick() : 
zhuanye- oonboboxZhuanye.get () 
if not zhuanye: 
tkinter.nessageboic showerror (title= "fü If ', message= ' 请 选择 专业 ') 
retum 
# 根 据 选择 的 专业 ,获取 该 专业 所 有 学 生 名 单 ,格式 为 "学 号 ,姓名 " 
temp= Common .getXuehacXingning (zhuanye) 
for row in treeXueshengMingdan.get children(: # 删 除 原 有 的 所 有 行 
treeXueshengMingdan.delete (row) 
iii-0 
for student in temp: 
student- student. split(',') # 分 隔 学 号 和 姓名 
treceshengMingcen. insert ('', iii, values- (scent [0], sudent[1])) 
# 创 建 表格 ,设置 表 头 ,show= "headings" 用 来 隐藏 树 形 控件 的 默认 首 列 
self.frame- tkinter.Frame (self.top) 
self.frame.place (x- 20, y= 50, width= 200, height= 280) 
# 垂 直 滚动 条 
scrollBar= tkinter.Scrollbar (self.frame) 
scrollBar.pack(side- tkinter.RIGHT, fill- tkinter.Y) 
# 使 用 树 形 控件 实现 表格 
treeXueshengMingdanr tkinter.ttk. Treeview (self. frare, colums- ('coll', 'col2'), show-" 
headings", yscrollcammand- scrollBar.set) 
trecxneshengMingdan. colum ('c011', width- 90, anchor- 'center") 
trecxneshengMingdan. column ('c012' , width- 90, anchor- 'center") 
trecxneshengMingdan.heading (coll', text= "学 号 
trecxneshengMingdan.heading (co12', text= ' 姓 名 小 
# 双 击 某 行 学 生 信息 ,双击 实现 离线 点 名 
def onClick (event) : 
if not treeXueshengMingdan. selection () : 
tkinter.messagebox.showerror ("B JL EK '，' 请 选择 学 生 ') 
return 
item- trecxueshengMi ngdan. selection () [0] 
xuehaoDianming- treeXueshengMingdan.item(item, 'values') [0] 
xinguingDianming- treeXueshengMingden.item(item, "values') [1] 
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currentTime- Cammon.getCurrentDateTime () 
# 获 取 一 个 半 小 时 之 前 的 时 间 
startTime- Camon.getStartDateTime () 
# 查 看 是 否 已 经 点 名 过 ,避免 一 个 半 小 时 内 重复 点 名 
sqlshifouchongfuDianmingr "SELECT count (xuehao) FROM dianming WHERE xuehao= '"+ 
xuehacDianmingt "' AND shijian >= "+ startTimet "'" 
if Common.getDataBySQL (sq1Shi fouchongfuDiarming) [0] [0] != 0: 
tkinter.messagebox. showerror (*ff 48 $k ', xuehacDianmingt ', "+ xingmingDianmingt ' 
重复 点 名 ') 
retum 
# 点 名 
sqlDiarming- "INSERT INIO dianming (xuehao, shijian) VALUES ('"+ xuehacDianmingt"', '"+ 
currentTime* "')" 
Common. doSQL (sql Dianming) 
tkinter.messagebox. showinfo ("A E ' 
xuehacDiarming* ','*xingmingDianming* ' 点 名 成 功 ') 
treeXueshengMingdan.bind ("< Double- 1» ", onDBClick) 
treeXueshengMingdan.pack (side= tkinter.IEFT, fill- tkinter.Y) 
# 树 形 控件 与 垂直 滚动 条 结合 
scrollBar.config (command treeXueshengMi ngdan. yview) 
buttonChakan- tkinter.Button (self .top, text= "PE ', comand 
buttonChakanClick) 
buttonChakan.plaoe (x= 130, y= 20, height=20, width= 40) 
def buttonJiafenClick(): 
# 首 先 选 择 一 个 学 生 , 然 后 加 分 
# 为 该 学 生 添加 一 个 提问 得 分 ,5 分 
if not treeXueshengMingdan. selection () : 
tkinter.messagebox.showerror ('fR JU Hk ',，' 请 选择 学 生 ') 
retum 
item- treeXueshengMi ngdan. selection () [0] 
xuehaoJiafen- treeXueshengMingdan.item(item, 'values') [0] 
sqlJiafen- "INSERT INTO tiwen (ehao, shijian, defen) VALUES ('" + xuehaoJiafen +"', "+ 
Camcn.getCurrentDateTime ()+ "',5)" 
Canon. doSQL (sqlJiafen) 
tkinter.messagebox.showinfo (A EE ', "JA 2I ") 
buttonJiafen- tkinter.Button (self.tcp, text= ' 听 课 认 真 加 分 '， 
camand- buttonJiafenclick) 
buttonJiafen.place (x-30, y= 350, height=20, width= 100) 
def buttonJianfenClick() : 
# 首 先 选择 一 个 学 生 ,然后 减 分 
# 为 该 学 生 添加 一 个 提问 得 分 ,- 5 分 
if not treeXueshenMingdan. selection () : 
tkinter.messagebox.showerror ("B MEL K '，' 请 选择 学 生 ') 
retum 
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ite treeXueshengMingdan. selection () [0] 
xuehaoJiafen- treeXueshengMingdan.item(item, 'values') [0] 
sqlJiafen= "INSERT INTO tiwen (xuehao, shi jian,defen)VATUES 
("4+ xu&heoJiafent "' , "4+ Oammen.getCurrentDateTime ()- "*,- 5)" 
Common. doSQL (salJiafen) 
tkinter.messagebox showinfo ("d BE *, "Wir JI ") 
buttonJianfen- tkinter.Button (self.top, text= ' 听 课 不 认真 减 分 '， 
cammand- buttonJianfenClick) 
buttonJianfen.place (x= 140, y= 350, height= 20, width= 100) 
labelTishi- tkinter.Label (self.tcp, text= ' 温 声 提 示 :双击 表格 中 某 个 学 生 可 以 离线 点 名 ， 
或 者 补 点 名 。… fg- red!) 
labelTishi.place(x- 10, y= 380, height= 20) 
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图 16-3 离线 点 名 与 加 分 功能 


16.6 随机 提问 功能 


随机 提问 功能 用 来 从 指定 专业 的 学 生 名 单 中 随机 抽取 一 名 同学 ,然后 由 教师 提问 题 
并 记录 回答 情况 。 这 样 的 功能 对 所 有 同学 都 是 公平 的 ,可 以 避免 老师 总 是 习惯 性 地 提问 
学 习 较 好 的 同学 ,真是 蔡 那 些 不 受 学 习 的 孩子 们 高 兴 啊 。 


class windowTiwen: 
def init (self, root, myTitle): 


self.top- tkinter.Toplevel (root, width= 300, height= 150) 
self.top.title (myTitle) 

self.top.attributes ('- togmost', 1) 

# 学 生 专业 

xueshengzhuanye- Common .getZhuanye () 
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 oanibcbaZenye- tkinter tk. Omibobok (self. top, values-eshenghienye) 
conibaboxZhuanye.place (x= 20, y= 20, height=20, width= 100) 
# 被 提问 到 的 学 生 学 号 
xueshencuehao- tkinter.StringVar (self.top, value= '') 
def buttonTiwenClick() : 
zhuanye- carbaboxZhuanye.get () 
if not zhuanye: 
tkinter meesecebas showerror (title= RHR ', message ' 请 选择 专业 ') 
retum 
# 获 取 该 专业 的 学 生 名 单 
conn- sql ite3.connect ('database.db') 
cur- conn.cursor () 
cur.execute ("SELECT xuehao, xingning FROM students WHERE zhuanye- '" + zhuanye+ "''") 
temp- cur. fetchall () 
conn.close 
# 从 该 专业 所 有 学 生 名 单 中 随机 选择 一 个 
temp- randam.choice (temp) 
xuehao- temp[0] 
xueshengXuehao. set (xuehao) 
tkinter.messagebox. showinfo (title= "恭喜 message- ' 本 次 中 奖 同学 为 '+ str (tem [0], 
tem[1]))) 


buttonTiwen- tkinter.Button (self.top, text= ' 看 看 谁 最 幸运 '， 
omand= buttonTiwenClick) 
buttonTiwen.place (x= 130, y= 20, height=20, width= 80) 
# 根 据 学 生 答 题 情况 进行 加 分 或 减 分 
cmboboxDefer= tkinter.ttk.Combobox (self .top, 
values [— 2*, '- 1*, "0, '1', '2', '3', "4*, '5']) 
canbcboxDefen.place (x= 20, y= 50, height=20, width= 100) 
def buttonDefenclick(): 
if xueshengxuehao.get ()== ' ': 
tkinter.messagebox. showerror (title= "flit dk ' message ' 请 先 选 择 同 学 ') 
retum 
defen- corbaboxDefen.get () 
if not defen: 
tkinter.messagebox. showerror (title= "fR ELI ', message ' 请 选择 得 分 ') 
else: 
# 记 录 该 学 生得 分 
sql= "INSERT INTO tiwen (mehao, shijian, defen) VALUES ('"+ xueshengXuehao.get ()+ "'', 
‘n+ Camon.getOurrentDateTime ()+ "',"+ defent ")" 
Cammcn.dcsoL (sql) 
tkinter.messagebox. showinfo (title= "恭喜 
message ' 添 加 提问 情况 成 功 !) 
buttonDefen- tkinter.Button (self.top, text= ' 确 认得 分 '， 
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command buttonDefenClick) 
buttonDefen.place (x- 130, y= 50, height- 20, width= 80) 


随机 提问 界面 如 图 16-4 所 示 。 
ma eee) 
~ BESREE 
确认 得 分 


图 16-4 随机 提问 界面 


16.7 在 线 收 作 业 功 能 


在 这 个 设计 中 ,支持 学 生 端 进行 全 屏幕 截图 和 上 传 文件 这 两 种 交 作业 的 方式 。 其 中 ， 
全 屏幕 截图 是 把 学 生 端 计算 机 整个 屏幕 的 内 容 进行 截图 然后 以 图 像 文件 的 形式 发 送 到 教 
师 端 ,而 上 传 文件 是 学 生 端 选择 Python 源 程序 文件 或 者 RAR 压缩 包 发 送 到 教师 端 。 通 
过 Socket 发 送 文件 的 代码 是 相似 的 ,这 里 只 介绍 截图 交 作业 的 代码 ,上 传 文件 交 作业 的 
代码 可 以 查看 本 书 配套 资源 。 
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学 生 端 使 用 pillow 中 ImageGrab 模块 的 grab() 方 法 进行 全 屏幕 截图 ,把 截图 文件 保 
存 到 当前 文件 夹 中 ,然后 把 这 个 图 像 文 件 通过 Socket 发 送 给 教师 端 。 


def buttonZuoyeClick() : 

# 获 取 学 号 和 姓名 

xuehao- entryXuehao.get () 

xingning- entryXingming.get () 

# 获 取 输 入 的 服务 器 Pbi FREESE HE 

serverIP- entryServerIP.get () 

if not re.match('^\d{1,3}\ -\d{1,3}\ -\d{1,3)\ Ad(1,3)$ ', serverIP) : 
tkinter.messagebox. showerror ("f AL BK", RAE PRAA ') 
retum 

# 创 建 socket, 并 连接 教师 端 

sock= socket.socket(socket.AF INET, socket.SOCK STREAM) 

try: 
Sock.connect ((serverIP, 30300)) 

except Exception as e: 
tkinter.messagebox.showerror (RH '，' 现 在 不 是 交 作 业 时 间 ") 
retum 

# 截 图 并 保存 成 文件 

filename-xuchaot ' '4 xingmingt '.png' 
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im- ImegeGrab.grab () 
im.save (filename) 


im.close() 


BUESIZE- 1024 
FIIEINFO SIZE- struct.calcsize ('I128s1') 


# 发 送 截 图 文件 的 基本 信息 

fhead struct .pack ('I128sT', len (filename) ,filename.enoode (), 
os.stat (filename) .st_size) 

# 发 送 文 件 名 和 大 小 等 信息 ,接收 服务 器 反馈 

sock.send (fhead) 

data= sock. recv (1024) 

data= data.deoode () 


if data.lower()- — 'notmatch' : 
tkinter.messagebox. showerror ("很 抱 菊 '，' 学 号 与 姓名 不 匹配 ') 
sock.close () 
retum 


# 发 送 文件 ,发送 结束 后 关闭 Socket 
fp- open (filename, 'rb') 
while True: 
filedata- fp. read (BUFSIZE) 
if not filedata: 
break 
sock.send(filedata) 
fp.close() 
sock.close() 
tkinter.messagebox.showinfo ("JS EE ', EMEARI ") 
# 在 学 生 端 主 窗口 上 添加 按钮 
buttonZucye= tkinter.Buttcn (root, text= ' 全 屏 截图 交 作业 '，command butconzuoyeclick) 
buttonZuoye.place (x= 120, y= 90, width=100, height= 20) 
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教师 端的 功能 要 复杂 很 多 ,因为 要 同时 接收 很 多 学 生 上 传 的 图 片 ,所 以 使 用 了 多 线 
程 , 单 击 * 开 始 接收 截图 作业 ”按钮 之 后 ,启动 一 个 线程 来 监听 端口 ,每 当 有 学 生 端 建立 连 
接 提 交 作 业 时 ,针对 每 个 连接 再 创建 一 个 负责 接收 图 片 文件 的 线程 。 

首先 添加 一 个 用 来 控制 系统 状态 的 变量 int_zuoye,0 表示 停止 收 作业 ,1 表示 开始 收 作业 : 


int zuoye- tkinter.IntVar (root, value- 0) 
负责 监听 端口 的 线程 函数 代码 如 下 : 


def thread ZuoyeMain(): 
today= Canon. getCurrentDateTime () split () [0] 
if not os.path.exists (today) : 
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os. mkdir (today) 
# 创 建 sockst, 开 始 监听 端口 
global sockShouzuoye 
sockShouzuoye- socket.socket(socket.AF INET, socket.SOCK STREAM) 
SockShouzuoye.bind((**, 30300)) 
sockShouzuoye. listen (200) 
while int zuoye.get()--1: 
time.sleep (0.05) 
try: 
# 接 受 学 生 端 连接 
conn, addr- sockShouzuoye.acoept () 
exoept: 
retum 
# 针 对 每 个 学 生 端 的 连接 再 创建 一 个 负责 接收 图 片 文件 的 线程 
t= threading. Thread (target= thread ShouZuoye, args- (conn, today) ) 
t.start() 
Sock.close() 


负责 接收 图 片 文件 的 线程 函数 代码 为 


def thread ShouZuoye (conn, today): 
# 最 终 把 客户 端 发 来 的 截图 保存 为 "学 号 ,姓名 .jpg" 
# 开 始 接收 客户 端 发 来 的 截图 
BUFSIZE- 1024 
FIIEINEO SIZE- struct.calcsize('I128sI') 
fhead- conn.recv(FILEINFO SIZE) 
filenamelength, filename, filesize- struct.unpack ('112881' , fhead) 
filename- filename.decode () 
filename- filename[:filenamelength] 
ttt- filename.split (' .") [0] 
# 如 果 学 号 和 姓名 不 匹配 ,拒绝 接收 作业 图 片 
xuebao, xingming= ttt.split( ") 
sql= "SELECT count (xuehao) FRM students WHERE xuehao- '"+ 
xuehao.strip()* "' AND xingning- '"+ xingning.strip()* "'" 
t= Camon.getDataBySQUL (sql) [0] [0] 
wte 
conn.sendall ('notmatch' .encode () ) 
conn.close() 
return 
else: 
conn.sendall (*ok' .encode () ) 
# 接 收 蕉 图 文件 基本 信息 
filename- filename[:- 4]+， '.join(Cammn.getCurrentDateTime () .split ())* V 
filename[- 4:] 
filename- filename.replace('- ', ' ") 
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filename filename.replace(':', '_') 
filename- today* '\ \ '*- filename 


# 首 先 删除 本 次 作业 期 间 之 前 上 交 的 作业 ,只 保留 最 后 一 次 的 作业 
for f in os.listdir(today) : 
if f.startswith (ttt) : 
os.remove (todayt 'NV- f) 


# 接 收 本 次 作业 
fp- open (filename, 'ub") 
restsize- filesize 
while True: 
if restsize» BUFSIZE: 
filedata- conn.recv (BUFSIZE) 
else: 
filedata- conn.recv (restsize) 
if not filedata: 
break 
外 -write (filedata) 
restsize- restsize- len (filedata) 
if restsize ==0: 
break 
fp.close() 
conn.close() 


16.8 在 线 自 测 与 在 线 考 试 功能 


利用 已 导入 的 题库 ,在 线 自 测 功 能 可 以 让 学 生 在 规定 的 时 间 段 内 检验 自己 对 所 学 知 
识 掌 握 的 程度 ,可 以 自由 选择 题 号 进行 查看 ,也 可 以 查看 标准 答案 。 而 在 线 考 试 功能 则 由 
系统 从 题库 中 为 每 个 学 生 随 机 抽取 100 道 题 发 送 给 学 生 端 ,每 个 学 生 在 同一 时 间 所 答题 
目 不 一 样 ,完全 避免 了 作弊 的 可 能 , 答 完 题 后 系统 自动 阅卷 并 计算 得 分 。 在 线 自 测 功能 的 
代码 与 在 线 考试 的 功能 类 似 , 都 是 监听 端口 和 启动 线程 然后 通过 Socket 发 送 题目 ,区 别 
在 于 在 线 自 测 功能 可 以 自由 选择 题目 并 且 可 以 查看 答案 ,而 在 线 考试 功能 是 由 系统 随机 
分 配 题目 并 且 不 允许 查看 答案 。 下 面 重点 介绍 在 线 考 试 功能 , 自 测 功能 代码 可 以 查看 配 
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学 生 端 输入 学 号 和 姓名 之 后 ,系统 首先 根据 已 导入 的 学 生 名 单 进行 检验 ,如 果 学 号 和 
姓名 正确 则 进入 考试 界面 ,系统 随机 分 配 题 目 , 每 道 题 必 须 答 完 才能 进入 下 一 题 , 不 允许 
跳 过 任何 一 道 题 。 这 部 分 功能 的 主要 代码 如 下 : 


class windowKaoshi: 
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def init — (self, root, conn, xuehaoxingming) : 


# 创 建 面板 容器 ,用 于 放置 其 他 控件 

self.top- tkinter.Toplevel (root, width- 300, height- 220) 
self.tcp.title(" ^E Ej illl - — —  xuehaoxingning) 
self.top.attributes ('- togmost', 1) 

# 不 允许 改变 窗口 大 小 

self.top.resizable (False, False) 


# 自 定义 关闭 窗口 事件 
def closeWindow(): 
if int windowZice.get()- —- 1: 
int windowZice.set (0) 
conn.sendall ('zoox' .encode () ) 
conn.close() 
self.top.destroy() 
self.top.protocol('WM DELETE WINDOW', closeWindow) 


# 从 服务 器 接收 课程 名 称 清 单 ,用 组 合 框 显示 
data= conn.recv(1024) 
data- data.decode () 
kechengoingdan- data.split (', ') 
labelKechengningcheng- tkinter.Label (self.top, text= ' 请 选择 课程 名 称 :') 
labelKechengningcheng.place (x= 10, y= 10, height=20, width= 100) 
caribcboxKechengni ngcheng- tkinter.ttk.Combabox (self .top, 
values- kechengQingdan) 
corbaboxKechengmingcheng.place (x= 120, y- 10, height- 20, width= 130) 
# 每 次 改变 课程 名 称 时 ,把 self.currentID 重 新 设置 为 0 
def comboxboxKechengmingChanged (event) : 
self.currentID=0 
carbcboxKechengmingcheng.bind('< < CanibaboxSelected» > ', 
carboxboxKechengni ngchanged) 


# 使 用 标签 组 件 显示 课程 名 称 
string Kecheng- tkinter.StringVar (self.top, value= '') 
labelKecheng- tkinter.Label (self.tcp,text- '', textvariable- string Kecheng) 
labelKecheng.place (x-10, y= 40, height=20, width= 100) 
# 使 用 可 滚动 的 文本 框 显示 题目 内 容 
entryMessage- tkinter.scrolledtext.ScrolledText (self top, 
wrap- tkinter.WORD) 
entryMessage.place (x= 10, y- 70, width=280, height= 70) 


# 下 一 题 按 钮 
def buttorNextClick() : 
# 获 取 当 前 选择 的 课程 
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kechengningchengSelected- conbcboxFechengmingcheng.get() 

if not kechengningchengSelected: 
tkinter.messagebax. showerror (MRR, ARREA ') 
retum 


# 必 须 做 系统 随机 分 配 的 每 一 道 题 

if entryMessage.get (0.0) .strip() (= '' and entryDaan.get() .strip()== '': 
tkinter.messagebox.showinfo (RHR, 29 GC Te") 
retum 


# 检 查 答 案 长 度 ,禁止 向 服务 器 发 送 太 长 的 内 容 

if len(entryDaan.get ()) » — 200: 
tkinter.messagebox.showerror (RHR, ERAK 
retum 


# 提 交 答 案 ,同时 获取 下 一 题 
message = (kechengmingchengSelectedt 'xx'+ str (sel f.currentID) - 'xx'+ 
entryDaan.get ()+ 'xxmext') 
conn. sendal] (message .encode () ) 
data= conn.recy (1024) 
data= data.decode () 
if data.startswith (no, ') : 
fenshu- data.split(', ') [1] 
tkinter.messagebox. showinfo (title= "恭喜 ,message= ' 得 分 :'+ 
fenshu) 
EH UT — BL 
buttonNext ['state']- 'disabled' 
retum 
kechengningcheng, zhangjie, timu, self.currentID- data.split ('xx') 
# 删 除 原来 的 题目 内 容 , 显 示 新 题目 内 容 
entryMessage.delete (0.0, tkinter.END) 
entryMessage.insert (tkinter.INSERT, timi) 
string Kecheng.set (kechengningcheng) 
# 删 除 上 一 题 学 生 输入 的 答案 
entryDaan.delete (0, tkinter.END) 
buttonNext= tkinter.Button (self.top, text= ' 下 一 题 ', ccmmand- 
buttonNextClick) 
buttorNext.place (= 10, y= 150, width= 60, height=20) 
# 填 写 答案 的 文本 框 
entryDsan- tkinter.Entry (self .top, ) 
entryDaan.place (x= 10, y- 180, width- 270, height= 20) 


# 开 始 答题 
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buttonNextClick() 


1682 Nj ds 


教师 端 通过 两 个 按钮 来 控制 考试 时 间 ,开始 考试 后 ,系统 启用 一 个 线程 监听 端口 并 接 
受 学 生 端的 连接 ,针对 每 个 学 生 连 接 再 创建 一 个 线程 来 随机 分 配 题目 并 接收 学 生 答案 。 
负责 监听 端口 的 线程 函数 代码 如 下 : 


def thread xueshengKaoshiMain() : 
gldoal sockKaoshi. 
# 创 建 socket, 监 听 18000 3i F1 
sockKaoshi- socket.socket(socket.AF INET , socket.SOCK STREAM) 
SockKaoshi.bind(('', 18000)) 
# 最 多 允许 同时 200 个 学 生 考试 
sockKaoshi .listen (200) 
#int xueshengKaoshi 是 表示 系统 状态 的 变量 ,1 表示 正在 考试 
while int xueshengKaoshi .get ()- — 1: 
try: 
conn, addr= sockKaoshi accept () # 接 受 一 个 连接 
exoept: 
return 
# 创 建 并 启动 考试 线程 
t Kaoshi- threading. Thread (target= thread xueshengKaoshi, args- (conn,)) 
t Kaoshi.start() 
sockKaoshi .close () 


负责 随机 分 配 题目 和 接收 学 生 答案 的 线程 函数 代码 如 下 : 


def thread xueshengKaoshi (conn) : 

# 接 收 学 号 和 姓名 

data- conn.recv (1024) 

data- data.decode () 

xuehao, xingning- data.split (',') 

# 检 查 学 号 ,姓名 是 否 匹 配 和 正确 

sql = ("SELECT cant (xuehao) FROM students WHERE xuehao- '"+ xuehao.strip()+ 
"' AND xingning- "+ xingning.strip()* "'") 

t= Camon.getDataBySQL (sql) [0] [0] 

if t !=1: 
conn. sendal] ('notmatch' .encode () ) 
conn.close() 
retum 

els: 
conn.sendall ('ok' .encode ()) 


# 获 取 并 向 客户 端 发 送 题库 中 的 课程 名 称 , 以 逗号 隔 开 
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sqlKechengmingcheng= "SELECT distinct (kechengningcheng) FROM tiku" 
kechenggingdan- [] 
for kecheng in Cammn.getDataBySQL (sqlKechengningcheng) : 
kechengQingdan.append (str (kecheng[0]  ) 
kechenggingdan- ', ' . join (kechengoi ngdan) 
conn. sendall (kechenggingdan. encode () ) 
# 开 始 考试 ,如 果 客 户 端 发 来 om, 表示 结束 考试 
while int xueshengKaoshi.get ()-— 1: 
data= conn.recv (1024) 
data= data.decode () 
if data == 'xxxx': 
conn.recv (1024) 
break 
# 接 收 学 生 提交 的 答案 
kechengningcheng, currentID, daan, pre next- data.split ('xx') 
if pre next == 'next': 
# 把 本 题 学 生 答案 记录 ,不 记录 0 号 题 


if currentID != '0': 


# 自 动 阅卷 

if daan ==biaozhundaan: 
shifouzhengque- 'Y' 

# 如 果 标 准 答案 中 有 空格 ,重新 修正 学 生 答案 

# 考 虑 学 生 输 入 多 个 连续 空格 的 情况 

# 例 如 pip list 等 价 于 pip list 

elif ' '.join(biaozhundaan.split ())==" '.join(daan.split ()): 
sShifouzhengque- 'Y' 


# 填 空 题 ,help 和 help() 两 种 形式 的 答案 都 算 对 
elif biaozhundaan.endswith (' () ') and daan= = biaozhundaan[:- 2] : 
sShifouzhenggue- 'Y' 
# 考 虑 学 生 没有 输入 空格 的 情况 ,例如 [1,2,3] 等 价 于 [1, 2, 3] 
elif ''.join(biaozhundaan.split ())== ' ' .join (daan.split ()) : 
shifouzhengque- 'Y' 
else: 
shifouzhenggue- 'N' 
sql= ('INSERT INIO kaoshi (xuehao, xingning, timibianhao, xueshengdaan, biaozhundaan, 
shifouzhenggue, shijian)VALUES("'4 xuehaot '","'4-xingningt '", '+ currentID* ',"4- 
daant '","'4- biaozhundaant '","'+ shifouzhengque* '","'+ Camon.getCurrentDateTime () 
$9) 
Common .doSQL (sat) 


樟 | 断 学 生 是 否 已 答 100 题 ,若是 则 不 允许 继续 答题 ,同时 发 送 考试 得 分 
sql= "SELECT count (xuehao) FROM kaoshi WHERE xuehao- "+ xuehaot nn 
total- Comon.getDataBySUL (sal) [0] 

if total[0] »- 100: 
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ccrn.sercil (no, + str (CamcngFtFacahiDefen (ehao) )) encod ()) 
break 


# 发 送 下 一 题 
sqlHasMpre = (" SELECT kechengmingcheng, zhangjie, timi, id, daan FROM tiku WHERE 
kechengningcheng- "+ kechengningchengt "' AND id NOT IN (SELECT timibianhao FROM kaoshi 
WHERE xuehao- ""+ xuehaot "')ORDER BY random() limit 1") 
ttt= Cammon.getDataBySQL (sql HasMore) 
if ttt: 
tttt- ttt[0] 
message- tttt [0]+ 'xx'+ tttt [1]+ "oc tttt [2]+ "x str (tttt[3]) 
# 记 录 本 题 答案 ,评分 用 
biaozhundaan- str (tttt [4]) 
conn.sendall (message .encode () ) 
else: 
am. srl] ((*no, "+ str (Gamcn.getFacshiDefen (ashap))) encode () ) 
conn.close() 


16.9 信息 查看 功能 


系统 支持 查看 学 生出 勤 情况 .提问 情况 ,考试 得 分 等 各 类 数据 ,为 老师 计算 学 生 的 平 
时 成 绩 和 最 终 成 绩 提供 重要 参考 和 依据 。 信 息 查看 界面 主要 代码 如 下 : 


class windowChakarTongjiQingkuang: 
def init — (self, root, myTitle): 
self.top- tkinter.Toplevel (root, width= 600, height= 380) 
self.top.title (myTitle) 
Self.top.attributes ('- topmpst' 1) 
# 获 取 学 生 专 业 列表 ,使 用 组 合 框 显 示 
xueshengzhuanye- Cormon .getZhuanye () 
anbbæZheny= tkinter .ttk.Omibdbox (self.top, values-xishennuanye) 
caibaboxZhuanye.place (x= 20, y= 20, height= 20, width= 120) 
# 查 看 指定 专业 所 有 同学 的 提问 情况 
def chakanZhuanye () : 
zhuanye- oadbcboxZhuanye get () 
if not zhuanye: 
tkinter.messagebox. showerror (B JL IK", "We Fee My ') 
retum 
else: 
xuehacXingnings- Cammon.getXuehaoXingning (zhuanye) 
nea [xinguing.split (*,') [0] for xinguing in xiuehecingnings] 
xinguings- [xinguirg.solit(',') [1] for xinguing in xebecinguings] 
# 获 取 每 个 同学 的 出 勤 次 数 ,缺勤 算 0, 没 提问 到 也 算 0 
chuginCishu- [Camcn.getchuginCishu (xuehao) for xuehao in 
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xuehaos] 
# 获 取 每 个 学 生 的 提问 得 分 和 主动 提问 次 数 
tiwenDefen- [Common.getTiwenDefen (xuehao) for xuehao in xuehaos] 
zhudongTiwenCi shu- [Cammon.getZhudongTiwenCi shu (xuehao) for 
xuehao in xuehaos] 
# 获 取 每 个 学 生 的 考试 得 分 
Jacahidefenr [Comon.getKacshiDefen (ehao) for xuehao in xuehaos] 
for row in tresXueshengMingdan.get_children () :# 删 除 原 有 的 所 有 行 
treekueshengMingdan.delete (row) 
iii-0 
# 各 类 信息 汇总 
tj-zip(xuehaos, xingnings, chuginCishu, tiwenDefen, 
for xeha, xinguing, hugin, tiwen, zhudngtiwen, kacshidefen in tj: 
# 把 信息 插入 表格 
tresXneshengMingan.insert ('"', iii, values= (uxhao, xinguing, 
chugin, tiwen, zhudongtiwen, 


kaoshidefen)) 
iiiciiitl 
buttonZhuanye- tkinter.Button (self.top, text= '# Ñ ', command- 
chakanZhuanye) 


buttonZhuanye.place (x= 150, y= 20, height- 20, width= 80) 


self.frame- tkinter.Frame (self .top) 
self.frame.place (x= 20, y= 50, width- 560, height= 320) 
# 垂 直 滚动 条 
scrollBar- tkinter.Scrollbar (self.frame) 
scrollBar.pack(side- tkinter.RIGHT, fill- tkinter.Y) 
# 使 用 树 形 控件 实现 表格 ,show= "headings" 用 来 隐藏 树 形 控件 的 默认 首 列 
treeXueshengMingdan- tkinter.ttk.Treeview(self.frame, colums- ('coll', 'col2', 'col3', 'col4 
*, 'col5', 'colé'), 

show "headings", 

yscrolloammand- scrollBar.set) 
# 设 置 表 头 
treexueshengMingdan.colum ("col1'，width= 70, anchor- 'center") 
trecxneshengMingdan. column ('0012', width- 50, anchor- 'center") 
trecxueshengMingdan. colum ('0013' , width- 120, anchor- 'center!) 
trecxueshengMingdan. colum ('c914' , width=120, anchor- 'center') 
trecxneshengMingdan. colum ('0015", width- 80, anchor- 'center") 
trecxueshengMingdan.colum ('o016' , width- 80, anchor- 'center") 
treeXueshengMingdan.heading('coll', text= "学 号 ') 
tresxueshengMingdan.heading('co12'， text= "姓名 小 
tresxueshengMingdan.heading('co13', text= ' 出 勤 次 数 ') 
tresxueshengMingdan.heading('co14', text= ' 老 师 提问 得 分 ") 
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treeXueshengMingdan.heading (col5', text- "主动 提问 次 数 )) 
treeXueshengMingdan.heading ('col6', text= ' 考 试 得 分 ') 
treeXueshengMingdan.pack (side- tkinter.IEFT, fill=tkinter.Y) 
# 树 形 控件 与 垂直 滚动 条 结合 

scrollBar.config(commandF treexueshengMingdan. yview) 


16.10 数据 导出 功能 


系统 的 数据 导出 功能 用 来 把 详细 的 学 生出 惑 记录 ,提问 记录 题库 访问 记录 和 考试 情 
况 导出 到 xlsx 文件 ,支持 数据 的 离线 查看 。 下 面 给 出 了 学 生 点 名 记录 的 代码 ,提问 记录 、 
题库 访问 记录 和 考试 情况 的 代码 类 似 ,完整 代码 请 查看 配套 资源 。 


def buttonDeochuClick () : 


try: 
import openpyxl 
fram openpyxl import Workbook 
exoept: 
tkinter.messagebox.showerror ('H R '，' 您 需要 安装 openpyxl 扩展 库 ') 
# 创 建 Workbook X1 
wb- Workbook () 
# 删 除 默 认 的 worksheet 
wb.remove sheet (wb.worksheets[0]) 
# 创 建新 的 worksheet, 导 出 点 名 记录 
ws-wb.create sheet (title= ' 在 线 点 名 情况 ') 
wa.append([ 学 号 "，' 姓 名 "点 名 时 间 "]) 
sql= 'SELECT students.xuehao, students.xingming, shijian FROM students, diarming WHERE students. 
xuehao- dianming.xuehao ORDER BY students.xuehao" 
data= Cammon.getDataBySQL (sql) 
# 把 数据 写 人 xlsx XC 
for d in data: 
ws.append([d[0], d[1], d[2]]) 
# 保 存 文件 
wb.save (I IR SP HB .xlsx') 
tkinter.messagebox.showinfo(A& EE ', "Sf Hi JL] LEES "CIS Se B onsec E) 


# 在 系统 主 界面 上 添加 按钮 
buttonDaoch= tkinter.Button (root, text= ' 数 据 导出 '，camman= 
buttonDaochu.place (x= 240, y- 260, height=30, width= 100) 


ick) 


16.11 其 他 辅助 功能 


考场 的 作 雌 和 防 作 此 是 个 永恒 的 话题 (严格 来 说 前 面 提 到 并 有 效 防范 的 同学 代替 别 
人 签到 也 算是 一 种 作 准 ,可谓 道 高 一 尺 魔 高 一 丈 , 作 洽 手法 千变万化 ,这 里 只 是 给 出 一 个 
在 线 考试 防 作 的 思路 。 另 外 ,为 了 自 适 应 不 同 的 机 房 , 不 需要 为 客户 端 手工 设 惫 服务 器 


第 16 章 课堂 教学 管理 系统 设计 与 实现 外 493 
e 


IP 地 址 ,这 个 系统 采用 了 UDP 广播 的 技术 实现 了 这 一 点 , 极 大 地 方便 了 用 户 使 用 。 最 
后 ,系统 还 提供 了 试卷 生成 功能 支持 离线 考试 。 


16111 防 作 刺 功能 


由 于 本 系统 提供 了 在 线 自 测 功能 ,学 生 在 平时 练习 时 可 能 会 整理 题库 并 保存 成 
Word 文档 ,这 样 的 话 考试 的 时 候 就 可 以 用 得 上 了 。 不 幸 的 是 ,这 种 形式 的 作弊 手法 已 经 
被 我 预料 到 并 且 有 效 地 避免 了 , 那 就 是 考试 时 禁用 学 生机 上 的 Word, WPS 和 记事 本 等 文 
本 编辑 器 进程 。 核 心 代码 如 下 : 


def funcJinyong() : 
import threading 
import psutil # 导 和 扩展 库 psutil, 需 要 先 安装 
fram os.path import basename 
while True: 
for id in psutil.pids(): # 列 出 当前 所 有 进程 1D 
try: 
p- psutil.Process (id) # 获 取 进 程 ,判断 对 应 程序 的 扩展 名 
if basename (p.exe ()) .lower ()in('notepad.exe', 'winword.exe', 
"wps.exe'): 
p-kil () # 结 束 进程 
except: 
pass 
time.sleep(3) # 暂 停 3 
t jinyong- threading.Thread (target= funcJinyong) 
# 创 建 线程 
t_jinyong.start () # 启 动 线程 


16112 服务 器 自动 发 现 功能 


在 整个 系统 的 设计 中 ,学 生 端 和 教师 端的 所 有 通信 都 是 通过 Socket 实现 的 ,这 就 要 
求学 生 端 必须 清楚 地 知道 教师 端 计 算 机 的 IP 地 址 。 这 个 系统 刚 投入 使 用 时 都 是 教师 先 
在 系统 中 查看 一 下 本 机 IP 地 址 ,把 这 个 IP 地 址 告诉 学 生 ,再 由 学 生 手工 输入 到 服务 器 IP 
地 址 文本 框 里 ,虽然 不 是 很 复杂 的 操作 ,但 是 也 比较 麻烦 。 后 来 给 学 生 上 课 讲 到 网 络 编程 
那 一 章 时 ,突然 想到 了 一 个 思路 , 那 就 是 教师 端 使 用 UDP 定期 广播 本 机 IP 地 址 ,而 学 生 
端 定时 接收 这 样 的 广播 信息 并 修正 最 新 的 服务 器 IP 地 址 。 于 是 ,服务 器 自动 发 现 功能 就 
这 样 诞 生 了 ,果然 是 教学 相 长 啊 。 

COD 教师 端 使 用 UDP 定期 广播 的 核心 代码 如 下 : 


def sendServerIP() : 
sock-socket.socket(socket.AF INET, socket.SOCK DRAM)  # 创 建 socket 对 象 
while True: 
IP= socket.gethostbyname (socket .gethostname () ) # 获 取 本 机 IP 
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IP- IP[:IP.rindex('.") ]*- ' .255* 
sock.sendto ('ServerIP' encode (), (IP, 5000) 
time.sleep(3) 

thread sendServerIP- threading. Thread (target sendServerIP) 

thread sendServerIP.start () 


(2) 学 生 端 定期 接收 广播 信息 的 核心 代码 如 下 : 


df findServer () : 
sock- socket.socket(socket.AF INET, socket.SOCK DGRAM) 
Sock.bind(('', 5000)) 
while int searchServer.get ()== 1: 
data, addr- sock.recvfram(1024) 
if data.decode ()== 'ServerIP': 
server IP.set (addr [0]) 
time.sleep(3) 
thread findServer- threading. Thread (target findServer) 
thread findServer.start () 


16113 Wbrd 版 试卷 生成 功能 


#255 表 示 广 播 地 址 
# 发 送信 息 

VE 3s 

# 创 建 线程 

# 启 动 线程 


# 创 建 socket 对 象 
SE Socket 


# 接 收 信息 
# 服 务 器 广播 信息 
# 修 正 服务 器 IP 


# 创 建 线程 
# 启 动 线程 


虽然 现在 很 多 学 校 的 程序 设计 课 是 在 机 房 里 以 边 讲 边 练 的 形式 授课 ,但 也 有 的 时 候 
需要 (也 或 者 是 任课 老师 的 个 人 喜好 ) 出 题 以 传统 的 纸 质 试卷 的 形式 进行 考试 。 本 系统 提 
供 了 试卷 生成 功能 ,可 以 从 题库 中 随机 抽取 100 道 题 并 生成 docx 文件 。 为 了 使 用 这 个 功 
能 ,需要 先 使 用 pip install python-docx 命令 安装 docx 库 才 行 , 主 要 代码 如 下 : 


def buttonGenerateShi juanClick () : 


nme tkinter.simpledialog.askinteger(' 请 输入 题目 数量 ',' 题 目 数量 ') 


if not num: 

retum 
conne sqlite3.connect ('database.db') 
cur- oonn.cursor () 
cur.execute ('SELECT timu,daan FROM tiku') 
temp- aur. fetchall () 
conn.close 


temp- randcm.sample (temp, num) 


yesno- tkinter.messagsbox.askyesno(" 按 题 型 排序 吗 ? ') 


if yesno: 
# 对 题目 类 型 排序 ,填空 题 在 前 ,判断 题 在 后 
temp.sort (reverse- True) 

fram docx import Document 

document- Document () 

docurent.add paragraph (" 试 题 ) 

fori, t in enumerate (temp) : 
document.add paragraph (str (i+ 1)+ "、 "+ t[0]) 
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doament.add page break() 

document.add paragrarh (VE R ") 

fori, t in enumerate (temp) : 

document.add paragraph (str (i+ 1)* ',  t[1]) 

document.save(" 试 卷 答案 .docx') 

tkinter.messagebox.showinfo(" 恭 喜 '，' 生 成 试卷 成 功 ) 

os.startfile(" 试 卷 答案 .gocx') 
buttonGenerateShijuar= tkinter.Button (root, text= "生成 Word 试卷 

omman buttonGenerateShi juanClick) 

buttonGenerateShijuan.plaoe (x= 20, y= 340, height= 30,width- 100) 


m dà 


当 看 到 这 一 页 内 容 的 时 候 ,您 应 该 是 松 了 一 口气 : 总 算 把 这 本 厚 厚 的 书 看 完了 。 在 
阅读 和 学 习 本 书 的 过 程 中 ,您 或 许 遇 到 过 不 少 困难 ,甚至 有 可 能 想 过 放弃 。 但 看 完 以 后 ， 
您 应 该 会 庆幸 自己 的 坚持 。 仔 细 想 想 , 其 实学 习 过 程 中 更 大 的 收获 ,应 该 是 学 会 一 个 又 一 
个 知识 点 之 后 的 快乐 ,这 种 快乐 只 有 全 身心 投入 其 中 的 人 才 更 能 真切 体会 。 

镜头 回 到 1999 年 春天 ,当时 还 在 山东 师范 大 学 物理 系 读 大 三 的 我 正在 积极 备战 计算 
机 等 级 四 级 考试 (后 来 去 拿 证 书 的 时 候 据 考 试 中 心 的 老师 说 ,当时 济南 考点 有 800 多 人 参 
加 四 级 考试 , 共 17 个 人 通过 ,只 有 2 个 人 是 优秀 ,而 我 就 是 其 中 之 一 ) 。 当 时 有 一 道 模拟 
题 耗费 了 我 整整 一 周 的 时 间 还 没 做 对 ,每 天 除了 吃饭 和 睡觉 之 外 都 在 里 思 若 想 , 一 天 差 不 
多 有 16 个 小 时 泡 在 机 房 里 (当时 我 利用 课余 时 间 在 机 房 帮忙 值班 近 2 年 ,随时 可 以 使 用 
计算 机 ) 。 第 八 天 中 午 , 我 去 山东 师范 大 学 北 街 买 了 25 个 内 包子 ( 不 是 我 饭量 大 ,而 是 脑 
力 劳动 消耗 太 多 ,我 这 么 说 您 肯定 相信 ), 回 机 房 的 路 上 突然 有 了 一 个 思路 ,然后 一 口气 冲 
到 机 房 里 ,包子 也 顾 不 上 吃 ,一 鼓 作 气 把 思路 实现 了 ,程序 运行 结果 非常 完美 。 当 时 我 一 
个 人 在 机 房 里 激动 地 走 来 走 去 ,每 隔 几 分 钟 就 开门 看 看 有 没有 人 来 上 机 ,后 来 终于 等 来 了 
一 个 上 机 的 同学 。 我 和 他 商量 了 一 下 ,把 我 刚 想 出 来 的 思路 和 实现 的 代码 讲 给 他 听 , 他 只 
要 分 享 我 的 快乐 就 可 以 免费 上 机 一 下 午 。17 年 过 去 了 .我 至 今 还 清晰 地 记得 当时 的 那 道 题 
和 我 解决 问题 的 思路 ,也 还 记得 当时 那 种 迫切 地 想 找 个 人 和 我 分 享 快乐 的 激动 心情 。 我 希 
望 , 在 阅读 本 书 的 过 程 中 ,在 不 断 提高 自己 的 过 程 中 ,您 也 能 体验 到 类 似 的 快乐 ! 一 分 耕耘 ， 
一 分 收获 ,这 是 永恒 的 道理 。 只 要 努力 了 就 会 有 收获 ,学 习 知 识 更 是 如 此 。 

欲 穷 千里 目 , 更 上 一 层 楼 。 您 可 能 已 经 发 现 了 ,目前 国内 市 面 上 像 本 书 涉及 面 这 么 广 
泛 并 且 深 入 的 Python 类 图 书 应 不 多 见 。 尽 管 如 此 ,我 们 必须 认识 到 ,在 通 往 Python 之 
着 的 道路 上 我 们 也 只 是 才 走 了 很 少 一 小 段 , 后 面 的 路 还 很 长 。 问 渠 那 得 清 如 许 , 为 有 源头 
活水 来 。 只 有 坚持 不 懈 地 学 习 才 能 一 直 保 持 前 进 的 步伐 。 浏览 Python 社区 ,阅读 
Python 官方 文档 ,阅读 Python 标准 库 和 扩展 库 的 源 代码 ,反复 优化 自己 写 过 的 代码 , 找 
个 实际 的 项 目 做 做 …… 这 都 是 不 断 提 高 自己 的 有 效 方式 。 

莫 悉 前 路 无 知已 ,天 下 谁 人 不 识 君 。 在 本 书 的 最 后 ,把 ( 别 董 大 》 里 的 这 各 名 言 赠 子 各 
位 读者 朋友 。 在 茫茫 Python 社区 ,希望 每 个 人 都 能 遇 到 几 个 志同道合 的 朋友 ,一 起 朝 着 
远方 出 发 ! 祝 您 早日 成 为 Python 高 手 ,也 祝 家 庭 幸福 美满 ! 在 学 习 Python 之 余 , 记 得 
要 注意 锻炼 身体 (例如 像 我 一 样 打 打 太极 举 ) ,更 别 忘 了 多 陪 陪 父母 ,对象 、 孩 子 或 者 身边 
的 朋友 。 生 活 不 止 是 眼前 的 Python ,还 有 亲情 和 友情 ! 


董 付 国 
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CD fp 3-1 面试 资格 确认 。 

(2) 例 3-2 ”用户 输入 若干 个 成 绩 , 求 所 有 成 绩 的 平均 分 。 每 输入 一 个 成 绩 后 询问 是 
否 继续 输入 下 一 个 成 绩 ,回答 yes 就 继续 输入 下 一 个 成 绩 ,回答 no 就 停止 输入 成 绩 。 

(3) 例 3-3 ”编写 程序 ,判断 今天 是 今年 的 第 几 天 。 

(4) fi 3-4 输出 序列 中 的 元 素 。 

(5) 例 3-5 求 1 一 100 之 间 能 被 7 整除 ,但 不 能 同时 被 5 整除 的 所 有 整数 。 

(6) 例 3-6 输出 "水 仙 花 数 "。 所 谓 水 仙 花 数 是 指 一 个 3 位 的 十 进 制 数 ,其 各 位 数字 
的 立方 和 恰好 等 于 该 数 本 身 。 例 如 ,153 是 水 仙 花 数 ,因为 153 王 13 十 5 十 33 。 

CD 例 3-7 求 平均 分 。 

(8) 例 3-8 打印 九 九 乘法 表 。 

(9) 例 3-9 求 200 以 内 能 被 17 整除 的 最 大 正 整数 。 

(10) 例 3-10 判断 一 个 数 是 否 为 素数 。 

ap 例 3-11 鸡 兔 同 笼 问题 。 假 设 共有 鸡 、 免 30 只 , 脚 90 只 , 求 鸡 、 免 各 有 和 多少 只 ? 

(12) 例 3-12 编写 程序 ,输出 由 1、2、3、4 这 4 个 数字 组 成 的 每 位 数 都 不 相同 的 所 有 
三 位 数 。 

(13) 例 3-13 ”编写 程序 ,计算 组 合 数 C(x. 站, 即 从 个 元 素 中 任 选 i 个 ,有 多 少 种 
选 法 ? 

(14) 例 3-14 编写 程序 ,计算 理财 产品 收益 ,假设 利息 和 本 人 金 一 起 滚动 。 

(15) 例 3-15 编写 函数 计算 圆 的 面积 。 

(16) 例 3-16 编写 函数 ,接收 任意 多 个 实数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 所 有 
参数 的 平均 值 ,其 他 元 素 为 所 有 参数 中 大 于 平均 值 的 实数 。 

(17) 例 3-17 编写 函数 ,接收 字符 串 参数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 大 写字 
母 的 个 数 ,第 二 个 元 素 为 小 写字 母 的 个 数 。 

(18) fj 3-18 编写 函数 ,接收 包含 20 个 整数 的 列表 Ist 和 一 个 整数 k 作为 参数 , 返 
回 新 列表 。 处 理 规则 : 将 列表 lst Fn k 之 前 的 元 素 逆 序 , 下 标 k 之 后 的 元 素 逆 序 , 然 
后 将 整个 列表 Ist 中 的 所 有 元 素 逆序 。 

(19) 例 3-19 编写 函数 ,接收 整数 参数 t, 返 回 斐 波 那 契 数列 中 大 于 € 的 第 一 个 数 。 

(20) 例 3-20 ”编写 函数 ,接收 一 个 包含 若干 整数 的 列表 参数 lst, 返 回 一 个 元 组 ,其 
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中 第 一 个 元 素 为 列表 lst 中 的 最 小 值 , 其 余 元 素 为 最 小 值 在 列表 lst 中 的 下 标 。 

(21) 例 3-21 编写 函数 ,接收 一 个 整数 t 为 参数 ,打印 杨辉 三 角 前 t 行 。 

(22) 例 3-22 ”编写 函数 ,接收 一 个 正 偶数 为 参数 ,输出 两 个 素数 ,并 且 这 两 个 素数 之 
和 等 于 原来 的 正 偶数 。 如 果 存 在 多 组 符合 条 件 的 素数 , 则 全 部 输出 。 

(23) 例 3-23 ”编写 函数 ,接收 两 个 正 整数 作为 参数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 
为 最 大 公约 数 ,第 二 个 元 素 为 最 小 公 售 数 。 

(24) 例 3-24 ”编写 函数 ,接收 一 个 所 有 元 素 值 都 不 相等 的 整数 列表 x 和 一 个 整数 
n, 要 求 将 值 为 n 的 元 素 作为 支点 ,将 列表 中 所 有 值 小 于 n 的 元 素 全 部 放 到 n 的 前 面 ,所 有 
EKF n 的 元 素 放 到 n 的 后 面 。 

(25) 例 3-25 ”编写 函数 ,计算 字符 串 匹配 的 准确 率 。 

(26) 例 3-26 编写 函数 ,对 整数 进行 因数 分 解 。 

(27) 例 3-27 韩信 点 兵 。 

(28) 例 3-28 模拟 发 红包 算法 。 

(29) 例 3-29 编写 函数 ,将 YYYY-MM-DD 的 日 期 形式 转换 为 YYYYQ 的 形式 ,其 
中 Q 表示 季度 。 

(30) 例 3-30 模拟 一 维 信号 卷 积 ,并 模拟 整数 乘法 。 

(3D 例 3-31 猜 数 游戏 。 系 统 随 机 产生 一 个 数 ,玩家 最 多 可 以 猜 5 次 ,系统 会 根据 
玩家 的 猜测 进行 提示 ,玩家 则 可 以 根据 系统 的 提示 对 下 一 次 的 猜测 进行 适当 调整 。 

(32) 例 3-32 计算 形式 如 a 十 aa 二 aaa 十 aaaa 十 … 十 aaa…aaa 的 表达 式 的 值 , 其 中 a 
为 小 于 10 的 自然 数 。 

(33) 例 3-33 有 个 人 围 成 一 圈 , 顺 序 排 号 。 从 第 一 个 人 开始 从 1 到 (假设 二 3) 
报 数 ,报到 的 人 退出 圈子 ,然后 圈子 缩小 ,从 下 一 个 人 继续 游戏 , 问 最 后 留 下 的 是 原来 的 
第 几 号 ? 

(34) 例 3-34 汉 诺 塔 问题 。 

(35) 例 3-35 编写 函数 计算 任意 位 数 的 黑洞 数 。 黑 洞 数 是 指 这 样 的 整数 : 由 这 个 
数字 每 位 数字 组 成 的 最 大 数 减 去 每 位 数字 组 成 的 最 小 数 仍然 得 到 这 个 数 自身 。 例 如 ,3 
位 黑洞 数 是 495 ,因为 954 一 459 二 495 ,4 位 数字 是 6174. D 7g 7641—1467 —6174, 

(36) 例 3-36 ”24 点 游戏 是 指 随机 选取 4 张 扑 克 牌 (不 包括 大 小 王 ) ,然后 通过 四 则 运 
算 来 构造 表达 式 , 如 果 表 达 式 的 值 恰好 等 于 24 就 赢 一 次 。 下 面 的 代码 定义 了 一 个 函数 用 
来 测试 随机 给 定 的 4 个 数 是 否 符合 24 点 游戏 规则 ,如 果 符 合 就 输出 所 有 可 能 的 表达 式 。 

(37) 例 3-37 ”双色球 是 一 种 比较 常见 的 彩票 玩法 ,每 一 注 彩 票 由 6 个 介 于 1 到 33 
之 间 的 不 重复 数字 和 1 个 介 于 1 到 16 之 间 的 数字 组 成 。 下 面 的 代码 用 来 随机 生成 一 注 
双色 球 彩 票 ,结果 是 完全 随机 的 。 

(38) 例 3-38 八 皇后 问题 。 八 皇后 问题 是 高 斯 先生 (就 是 小 时 候 就 把 1 十 2 十 3 十 … 
+100 转换 成 (十 100) X50 的 那个 数学 家 ) 在 60 多 年 以 前 提出 来 的 ,是 一 个 经 典 的 回潮 
算法 问题 ,其 核心 为 : 在 国际 象棋 棋盘 (8 行 8 列 ) 上 摆 放 8 个 皇后 ,要 求 8 个 皇后 中 任意 
两 个 都 不 能 位 于 同一 行 、 同 一 列 或 同一 斜 线 上 。 

(39) 例 4-1 设计 Person 类 ,并 根据 Person 派生 Teacher 类 ,分别 创建 Person 类 与 
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Teacher 类 的 对 象 。 

(40) 例 4-2.— 自 定 义 一 个 数组 类 ,支持 数组 与 数字 之 间 的 四 则 运算 ,数组 之 间 的 加 法 
运算 、 内 积 运算 和 大 小 比较 ,数组 元 素 访问 和 修改 ,以 及 成 员 测 试 等 功能 。 

(41) 例 4-3 模拟 矩阵 运算 ,支持 矩阵 转 置 ,修改 矩阵 大 小 ,矩阵 与 数字 的 加 、 减 、 乘 
运算 ,以 及 矩阵 与 矩阵 的 加 \ 减 、 乘 运算 。 

(42) 例 4-4 设计 自 定义 队列 类 ,模拟 入 队 、 出 队 等 基本 操作 。 

(43) 例 4-5 设计 自 定义 栈 类 ,模拟 入 栈 、 出 栈 、 判 断 栈 是 否 为 空 、 是 否 已 满 以 及 改变 
栈 大 小 等 操作 。 

(44) 例 4-6 设计 二 又 树 类 ,模拟 二 叉 树 创建 .插入 子 节点 以 及 前 序 遍 历 . 中 序 遍 历 
和 后 序 遍 历 等 遍历 方式 ,同时 还 支持 二 又 树 中 任意 子 树 的 节点 遍历 。 

(45) 例 4-7 设计 有 向 图 类 ,模拟 有 向 图 的 创建 和 路 径 搜索 功能 。 

(46) 例 4-8” 自 定义 集合 类 。 

(47) 例 5-1 编写 函数 实现 字符 串 加 密 和 解密 ,循环 使 用 指定 密 钥 ,采用 简单 的 异 或 
算法 。 

(48) 例 5-2 ”编写 程序 ,生成 大 量 随机 信息 。 

(49) 例 5-3 使 用 正则 表达 式 提 取 字 符 串 中 的 电话 号 码 。 

(50) 例 5-4 使 用 正则 表达 式 提 取 Python 程序 中 的 类 名 、 函 数 名 以 及 变量 名 等 标 

(51) 例 5-5 使 用 正则 表达 式 检查 Python 程序 的 代码 风格 是 否 符合 规范 。 

(52) 例 6-1 向 文本 文件 中 写 和 人 内容。 

(53) 例 6-2 读 取 文本 文件 内 容 。 

(54) 例 6-3. 读 取 并 显示 文本 文件 的 所 有 行 。 

(55) 例 6-4 移动 文件 指针 。 假 设 文件 sample. txt 中 的 内 容 原 为 “Hello world\n 文 
本 文件 的 读 取 方法 \n 文本 文件 的 写 人 方法 ”。 

(56) 例 6-5 假设 文件 data. txt 中 有 若干 整数 ,整数 之 间 使 用 英文 逗号 分 隔 ,编写 程 
序 读 取 所 有 整数 ,将 其 按 升序 排序 后 再 写 入 文本 文件 data. asc. txt 中 。 

(57) 例 6-6 ”编写 程序 ,保存 为 demo. py, 运 行 后 生成 文件 demo. new. py, 其 中 的 内 
容 与 demo. py 一 致 ,但 是 在 每 行 的 行 尾 加 上 了 行 号 。 

(58) 例 6-7 计算 文本 文件 中 最 长 行 的 长 度 和 该 行 的 内 容 。 

(59) 例 6-8 Python 程序 代码 复 用 度 检查 。 

(60) fij 6-9 使 用 pickle 模块 写 和 人 二进制 文件 。 

(61) 例 6-10 使 用 pickle 模块 读 取 例 6-9 中 写 和 人 二进制 文件 的 内 容 。 

(62) 例 6-11 使 用 struct 模块 写 人 二 进 制 文件 。 

(63) 例 6-12 ”使 用 struct 模块 读 取 例 6-11 中 二 进 制 文件 的 内 容 。 

(64) 例 6-13 将 当前 目录 的 所 有 扩展 名 为 html 的 文件 重 命名 为 扩展 名 为 htm 的 
文件 。 

(65) fi] 6-14 计算 文件 的 CRC32 fË. 

(66) 例 6-15 判断 一 个 文件 是 否 为 GIF 图 像 文件 。 任 何 一 种 文件 都 具有 专门 的 文 
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件 头 结构 ,在 文件 头 中 存放 了 大 量 的 信息 ,其 中 就 包括 该 文件 的 类 型 。 通 过 文件 头 信 息 来 
判断 文件 类 型 的 方法 可 以 得 到 更 加 准确 的 信息 ,而 不 依赖 于 文件 扩展 名 。 


(67) 例 6-16 
(68) 例 6-17 
(69) 例 6-18 
(70) 例 6-19 


使 用 xlwt 模块 写 和 人 Excel 文件 。 
使 用 xlrd 模块 读 取 Excel 文件 。 
使 用 Pywin32 操作 Excel 文件 。 
检查 Word 文档 的 连续 重复 字 。 在 Word 文档 中 ,经 常会 由 于 键盘 操 


作 不 小 心 而 使 得 文档 中 出 现 连续 的 重复 字 , 例 如 ,“ 用 户 的 资料 ”或 “需要 需要 用 户 输入 "之 
类 的 情况 。 本 例 使 用 Pywin32 模块 中 win32com 对 Word 文档 进行 检查 并 提示 类 似 的 重 


复 汉 字 。 

CD 例 6-20 编写 程序 ,进行 文件 夹 增 量 备份 。 

(72) 例 6-21 编写 程序 ,统计 指定 文件 夹 大 小 以 及 文件 和 子 文件 夹 数量 。 本 例 也 属 
于 系统 运 维 范畴 ,可 用 于 磁盘 配额 的 计算 ,例如 E-mail、 博客 .FTP. 快 盘 等 系统 中 每 个 账 
号 所 占 空间 大 小 的 统计 。 

(73) 例 6-22 编写 程序 ,统计 指定 目录 所 有 C++ 源 程序 文件 中 不 重复 代码 行 数 。 

(74) 例 6-23 编写 程序 ,递归 删除 指定 文件 夹 中 指定 类 型 的 文件 。 

(75) 例 6-24 使 用 扩展 库 openpyxl 读 写 Excel 2007 及 更 高 版 本 的 Excel 文件 。 

(76) 例 6-25 编写 代码 ,查看 指定 ZIP 和 RAR 压缩 文件 中 的 文件 列表 。 

(77) 例 6-26 小 学 口算 题库 生成 器 。 

(78) 例 6-27 将 docx 文档 中 的 题库 导入 SQLite 数据 库 。 

(79) 例 6-28 提取 docx 文档 中 例题 .插图 和 表格 清单 。 

(80) 例 6-29 ”将 指定 文件 夹 中 的 文件 压缩 至 已 有 压缩 包 。 

(81) 例 6-30 使 用 密码 字典 暴力 破解 RAR 或 ZIP 文件 密码 。 

(82) 例 6-31 把 Excel 2007+ 文 件 中 的 多 个 同 结构 worksheet 的 内 容 合并 到 新 文件 
中 的 一 个 worksheet 中 。 

(83) 例 6-32 ”把 记事 本 文件 test. txt 转换 成 Excel 2007* 文件 。 假 设 test. txt 文件 
中 第 一 行为 表 头 , 从 第 二 行 开 始 是 实际 数据 ,并 且 表 头 和 数据 行 中 的 不 同 字段 信息 都 是 用 
逗号 分 隔 。 

(84) 例 7-1 使 用 doctest 模块 测试 Python 代码 。 

(85) 例 7-2 编写 单元 测试 程序 。 

(86) 例 7-3 使 用 IDLE 调试 Python 程序 。 

(87) 例 9-1 UDP 通信 程序 。 

(88) 例 9-2 会 聊天 的 小 机 器 人 。 

(89) 例 9-3 网 络 嗅 探 器 程序 。 

(90) 例 9-4 端口 扫描 器 程序 。 

(91) 例 9-5 RISO ET. 

(92) 例 9-6 使 用 Flask 框架 编写 网 站 程序 。 

(93) 例 9-7 Python 十 Flask 十 Flask-email 发 送 带 附件 的 电子 邮件 。 

(94) 例 9-8 创建 第 一 个 django Web 应 用 。 
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(95) 例 9-9 素数 判断 。 

(96) 例 9-10 使 用 网 页 模板 。 

(97) 例 10-1 线程 对 象 的 join() 方 法 。 

(98) 例 10-2 ”线程 状态 检测 。 

(99) fij 10-3 ”线程 对 象 的 daemon 属性 。 

(100) 例 10-4 使 用 Lock/RLock 对 象 实现 线程 同步 。 

(101) 例 10-5 ”使 用 Condition 对 象 实现 线程 同步 。 

(102) 例 10-6 使 用 queue 对 象 实现 线程 同步 。 

(103) 例 10-7 ”使 用 Event 对 象 实现 线程 同步 。 

(104) 例 10-8 ”进程 创建 与 启动 。 

(105) 例 10-9 使 用 Queue 对 象 在 进程 间 交 换 数据 ,一 个 进程 把 数据 放 入 Queue 对 
象 , 另 一 个 进程 从 Queue 对 象 中 获取 数据 。 

(106) fj 10-10 ”使 用 管道 实现 进程 间 数据 交换 。 管 道 有 两 个 端 ,一 个 接收 端 和 一 个 
发 送 端 ,相当 于 在 两 个 进程 之 间 建 立 了 一 个 用 于 传输 数据 的 通道 。 

(107) 例 10-11 使 用 共享 内 存 实现 进程 间 数 据 传递 ,比较 适合 大 量 数据 的 场合 。 

(108) fj 10-12 使 用 Manager 对 象 实现 进 程 间 数据 交换 。 

(109) 例 10-13 使 用 Lock 对 象 实现 进程 同步 。 

(110) 例 10-14 使 用 Event 对 象 实现 进程 同步 。 

(111) fi 12-1 绘制 三 维 直线 、 二 维 三 角形 和 圆 。 

(112) 例 12-2 纹理 映射 与 计算 机 动画 。 

(113) fj 12-3 法 向 量 与 光照 模型 。 

OLD 例 12-4 计算 椭圆 中 心 。 

(115) 例 12-5 动态 生成 比例 分 配 图 。 

(116) 例 12-6 生成 验证 码 图 片 。 

(117) 例 12-7 GIF 动态 图 像 分 离 与 生成 。 

(118) 例 12-8 ”把 固定 大 小 的 图 片 进行 缩放 并 映射 到 任意 大 小 物体 表面 。 

(119) 例 12-9 使 用 pillow 进行 图 像 空域 融合 。 

(120) 例 12-10 使 用 pillow 生成 国际 象棋 棋盘 纹理 。 

(121) fij 14-1 恺 撤 密 码 算法 。 

(122) fij 14-2 维 吉 尼 亚 密码 。 

(123) fi] 14-3 换 位 密码 算法 。 

(124) 例 14-4 计算 文件 的 MD5 值 。 

(125) 例 14-5 使 用 Python 扩展 库 pycrypto 提供 的 AES 算法 实现 消息 加 密 和 
解密 。 

(126) 例 14-6 使 用 rsa 模块 来 实现 消息 加 密 和 解密 。 

(127) fi] 15-1. tkinter 实现 用 户 登录 界面 。 

(128) 例 15-2 tkinter 单 选 按钮 、 复 选 框 、 组 合 框 \ 列 表 框 综合 运用 案例 。 

(129) ffi] 15-3 使 用 tkinter 实现 文本 编辑 器 。 
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(130) fij 15-4 使 用 tkinter 实现 画图 程序 。 

(131) f] 15-5 使 用 tkinter 实现 电子 时 钟 。 

(132) 例 15-6 使 用 tkinter 编写 动画 。 

(133) 例 15-7 弹出 新 窗口 。 

(134) 例 15-8 使 用 tkinter 十 pillow 实现 屏幕 任意 区 域 截图 。 

(135) 例 15-9 使 用 pygame 十 threading 编写 音乐 播放 器 。 

(136) 例 15-10 {EJH tkinter+pillow+ socket 编写 远程 桌面 监控 软件 。 
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a) 图 1-1 
(2) 图 1-2 
(3) 图 1-3 
(4) 图 1-4 
(5) 图 1-5 
(6) 图 1-6 
(7) 图 1-7 
(8) 图 1-8 
(9) 图 1-9 


(10) 
(11) 
(12) 
(13) 
(14) 
(15) 
(16) 
(17) 
(18) 
(19) 
(20) 
(21) 
(22) 
(23) 
(24) 
(25) 
(26) 
(27) 
(28) 
(29) 


图 1-10 
图 1-11 
图 1-12 
图 1-13 
图 1-14 
图 1-15 
图 2-1 
图 2-2 
图 2-3 
图 3-1 
图 3-2 
图 3-3 
图 3-4 
图 3-5 
图 3-6 
图 3-7 
图 3-8 
图 3-9 
图 3-10 


图 4-1 
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Python 3.5. 1 IDLE 的 界面 
wingIDE 的 运行 界面 
PyCharm 的 运行 界面 
Eclipse 十 PyDev 的 运行 界面 
Python 官方 网 站 提供 的 Interactive Shell 入 口 
Python 官方 网 站 提供 的 Interactive Shell 界面 
Windows 7 环境 中 系统 Path 变量 的 修改 方法 
在 IDLE 中 运行 程序 
在 命令 提示 符 中 运行 程序 
配置 IDLE 并 增加 清 屏 菜 单 和 快捷 键 
Python 内 存 管理 模式 
Python 内 置 帮 助 系统 
从 Python 安装 文件 夹 的 scripts 文件 夹 进入 命令 提示 符 环境 
展开 Python 启动 程序 并 右 击 后 选择 “属性 ” 
选择 “打开 文件 位 置 ?按钮 进入 Python 安装 文件 夹 
Python 序列 分 类 示意 图 
双向 索引 示意 图 
reduce() 函 数 执行 过 程 示意 图 
逻辑 运算 符 与 几 种 电路 的 类 比 关 系 
单 分 支 选 择 结构 
双 分 支 选 择 结构 
代码 层次 与 隶属 关系 
函数 示意 图 
使 用 注释 来 为 用 户 提示 函数 使 用 说 明 
几 个 好 玩 的 表情 
一 维 序列 卷 积 计算 原理 示意 图 
把 卷 积 结 果 转 换 为 数字 
函数 递归 调用 示意 图 
列 出 对 象 公开 成 员 
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(30) 
(31) 
(32) 
(33) 
(34) 
(35) 
(36) 
(37) 
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(44) 
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图 4-2 
图 4-3 
图 5-1 
图 5-2 
图 6-1 
图 6-2 
图 7-1 
图 7-2 
图 7-3 
图 7-4 
图 7-5 
图 7-6 
图 7-7 
图 7-8 
图 7-9 
图 8-1 
图 8-2 
图 9-1 
图 9-2 
图 9-3 
图 9-4 
图 9-5 
图 9-6 
图 9-7 
图 9-8 
图 9-9 
图 9-10 
图 9-11 
图 9-12 
图 10-1 
图 10-2 
0-3 
0-4 
0-5 
0-6 
0-7 
1-1 
1-2 
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列 出 对 象 所 有 成 员 

二 叉 树 

字符 串 格式 化 

字符 串 加 密 与 解密 结果 

二 进 制 文件 无 法 使 用 文本 编辑 器 直接 查看 
使 用 Winhex 十 六 进 制 编辑 器 打开 可 执行 文件 
doctest 测试 过 程 示意 图 

IDLE 调试 器 窗口 

程序 调试 截图 (一 ) 

程序 调试 截图 (二 ) 

程序 调试 截图 (三 ) 

程序 调试 截图 (四 ) 

运行 程序 自动 进行 pdb 调试 模式 
在 命令 提示 符 环境 运行 程序 

使 用 命令 行 调试 程序 

运行 结果 (一 ) 

运行 结果 (二 ) 

使 用 ipconfig 命令 查看 本 机 IP 地 址 和 网 卡 物理 地 址 
UDP 通信 程序 运行 结果 

TCP 通信 程序 运行 结果 

在 TIS 中 创建 网 站 

配置 IIS 的 程序 映射 

网 站 运行 效果 (一 ) 

网 站 运行 效果 (二 ) 

网 站 启动 界面 (三 ) 

网 站 运行 效果 (四 ) 

启动 django 网 站 

素数 判断 

使 用 网 页 模板 

WPS 进程 中 某 个 线程 的 属性 
在 IDLE 环境 中 运行 

在 命令 提示 符 环境 中 运行 
WPS 创建 的 部 分 线程 

系统 中 每 个 进程 的 线程 数量 
使 用 Condition 实现 线程 同步 
使 用 Event 对 象 实现 线程 同步 
MapReduce 流程 

文件 切 分 结果 
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(68) 图 11-3 Map 结果 

(69) 图 11-4 Reduce 结果 

(70) 图 11-5 pyspark 开发 界面 

CD R 11-6 执行 Python 程序 

(72) 图 12-1 使 用 OpenGL 绘制 简单 图 形 
(73) 图 12-2 纹理 映射 

CAD 图 12-3 光照 模型 

(75) Fd 12-4 原始 lena 图 像 

(76) 图 12-5 部 分 区 域 被 旋转 180" 以 后 的 lena 图 像 
(77) F8 12-6 比例 分 配 图 

(78) 图 12-7 验证 码 图 片 

(79) 图 13-1 lena 图 像 处 理 结 果 

(80) [8 13-2. lena 图 像 模糊 处 理 结果 
(81) 图 13-3 原始 图 像 

(82) 图 13-4 高 斯 滤波 结果 

(83) 图 13-5 边缘 锐 化 结果 

(84) 图 13-6 中 值 滤波 结果 

(85) 图 13-7 原始 随机 图 像 

(86) 图 13-8” 开 运算 结果 

(87) 图 13-9 ”膨胀 运算 结果 

(88) 图 13-10” 闭 运算 结果 

(89) 图 13-11 绘制 曲线 图 结果 

(90) 图 13-12 绘制 柱状 图 结果 

(91) 图 13-13 水平 柱状 图 绘制 结果 

(92) 图 13-14 正弦 曲线 

(93) 图 13-15 余弦 散 点 图 

(94) 图 13-16 ” 散 点 图 

(95) 图 13-17 绘制 饼 状 图 

(96) 图 13-18 中文 标签 和 图 例 

(97) 图 13-19 标签 中 带 公 式 的 图 

(98) 图 13-20 ”多 图 形 同 时 显示 

(99) 图 13-21 绘制 三 维 参数 曲线 

(100) 图 13-22 绘制 三 维 图 形 ( 一 ) 

(101) 图 13-23 绘制 三 维 图 形 ( 二 ) 

(102) 图 13-24 使 用 指令 绘制 任意 图 形 
(103) 图 13-25 ”把 matplotlib 绘图 结果 做 入 tkinter 程序 中 
(104) 图 13-26 matplotlib 组 件 的 应 用 
(105) 图 13-27 根据 最 新 数据 动态 更 新 图 形 
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(106) 图 13-28 使 用 Slider 组 件 调整 曲线 参数 
(107) 图 14-1. 维 吉 尼 亚 密码 替换 表 
(108) 图 14-2 计算 文件 的 MD5 fi 
(109) 图 15-1 用 户 登录 界面 

(110) 图 15-2 密码 正确 

(111) 图 15-3 密码 错误 

(112) 图 15-4 程序 运行 效果 

(113) 图 15-5 ”简单 文本 编辑 器 
(114) 图 15-6 简单 画图 程序 

(115) 图 15-7 电子 时 钟 运行 截图 
(116) 图 15-8 动画 截图 

(117) 图 15-9 turtle 画图 示例 
(118) 图 15-10 MP3 播放 器 界面 
(119) 图 16-1 教师 端 主 界面 

(120) [8 16-2 学生 端 主 界面 

(121) 图 16-3 离线 点 名 与 加 分 功能 
(122) 图 16-4 随机 提问 界面 
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(1) 表 1-1 
(2) 表 1-2 
(3) 表 1-3 
(4) 表 1-4 
(5) 表 1-5 
(6) 表 2-1 
(7) 表 4-1 
(8) 表 5-1 
(9) 表 5-2 
(10) 表 5-3 
(11) 表 5-4 
(12) 表 5-5 
(13) 表 6-1 
(14) 表 6-2 
(15) 表 6-3 
(16) 表 6-4 
(17) 表 6-5 
(18) 表 6-6 
(19) 表 7-1 
(20) 表 7-2 
(21) 表 8-1 
(22) 表 10- 
(23) 表 10-2 
(24) 表 12- 
(25) 表 13- 
(26) 表 15- 
(27) 表 15-2 
(28) 表 15-3 
(29) 表 16- 
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IDLE 中 的 常用 快捷 键 
Python 内 置 对 象 
Python % H A EE PA 
Python 运算 符 
常用 pip 命令 使 用 方法 
常用 的 列表 对 象 方法 
Python 类 特殊 方法 
常见 的 转 义 字符 
格式 字符 
常用 的 正则 表达 式 元 字符 
常用 子 模式 扩展 语法 
re 模块 常用 方法 
文件 打开 模式 
文件 对 象 的 常用 属性 
文件 对 象 的 常用 方法 
os 模块 常用 成 员 
os. path 模块 常用 成 员 
shutil 模块 常用 成 员 
TestCase 类 的 常用 方法 
常用 pdb 调试 命令 
Connection 对 象 的 主要 方法 
threading 模块 常用 方法 与 类 
Thread 对 象 成 员 
mode 取 值 
scipy 工具 包 的 主要 模块 
tkinter 的 常用 组 件 
pygame 的 主要 模块 
mixer 模块 的 主要 方法 
表 结 构 
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CD 拓展 知识 : 如 果 有 读者 想 尝试 一 下 在 安 卓 手机 上 编写 Python 程序 ,可 以 安装 支 
持 Python 3. x 的 QPython3 或 者 支持 Python 2. x 的 QPython, 关 于 SLAA 和 安 卓 类 库 调 
用 的 相关 知识 可 以 查阅 相关 资料 。 

(2) 拓展 知识 : 自 定义 IDLE 清 屏 快 捷 键 。 

CD 拓展 知识 : Python 标准 库 fractions 中 的 Fraction 对 象 支持 分 数 运算 。 

(4) 拓展 知识 : Python 字符 串 对 象 提 供 了 一 个 方法 isidentifier() 可 以 用 来 判断 指定 
字符 串 是 否 可 以 作为 变量 名 、 函 数 名 、 类 名 等 标识 符 。 

(5) 拓展 知识 : Python 之 禅 。 

(6) 拓展 知识 : uas VOX S 1&1=1,1&0=081=08.0=0,1]1=1]0=0]1=1,0 
10==0,1 和 ==0^0==0、1^0==0 入 ==1, 左 移 位 时 右 侧 补 0, 右 移 位 时 左 侧 补 0。 

(7) 拓展 知识 : 复合 赋值 运算 符 。 

(8) 拓展 知识 : Python 标准 库 sys 还 提供 了 read() 和 readline() 方 法 用 来 从 键盘 接 
收 指定 数量 的 字符 。 

(9) 拓展 知识 : Python 标准 库 pprint 还 提供 了 更 加 友好 的 输出 函数 (pretty printer) 
pprint() ,可 以 更 好 地 控制 输出 格式 ,如 果 要 输出 的 内 容 多 于 一 行 则 会 自动 添加 换行 和 缩 
进来 更 好 地 展示 内 容 的 结构 。 

(10) 拓展 知识 : Python 支持 创建 多 个 虚拟 环境 ,每 个 虚拟 环境 都 是 包含 Python 和 
相应 扩展 库 的 一 个 目录 ,多 个 虚拟 环境 (文件 夹 ) 之 间 互 相 不 干扰 。 

(11) 拓展 知识 : 重新 导入 模块 。 

(12) 拓展 知识 : 导入 模块 时 文件 的 搜索 顺序 。 

(13) 拓展 知识 : 垃圾 回收 机 制 。 一 般 来 说 ,使 用 del 删除 对 象 之 后 Python 会 在 恰当 
的 时 机 调用 垃圾 回收 机 制 来 释放 内 存 , 我 们 也 可 以 在 必要 的 时 候 导 入 Python 标准 库 gc 
之 后 调用 gc. collect() 函 数 立 刻 启动 垃圾 回收 机 制 来 释放 内 存 。 

(14) 拓展 知识 : 排序 方法 的 key 参数 。 

(15) 拓展 知识 : 使 用 列表 模拟 向 量 运算 。 

(16) 拓展 知识 : 生成 器 对 象 。 

(17) 拓展 知识 : 内 置 函数 globals() 和 locals() 分 别 返回 包含 当前 作用 域内 所 有 全 局 
变量 和 局 部 变量 的 名 称 及 值 的 字典 。 

(18) 拓展 知识 : 有 序 字 上 典 。 
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(19) 拓展 知识 : 内 置 函 数 sorted() 可 以 对 字典 元 素 进行 排序 并 返回 新 列表 ,充分 利 
用 key 参数 可 以 实现 丰富 的 排序 功能 。 

(20) 拓展 知识 : Python 支持 字典 推导 式 快速 生成 符合 特定 条 件 的 字典 。 

(21) 拓展 知识 : 字典 和 集合 的 in 操作 比 列表 快 很 多 。 

(22) 拓展 知识 : 自 定 义 枚 举 类 型 。 

(23) 拓展 知识 : 集合 中 的 元 素 不 允许 重复 ,Python 集合 的 内 部 实现 为 此 做 了 大 量 相 
应 的 优化 ,判断 集合 中 是 否 包含 某 元 素 时 比 列 表 速 度 快 很 多 。 

(24) 拓展 知识 : Python 也 支持 集合 推导 式 。 

(25) 拓展 知识 : 逻辑 运算 符 与 常见 电路 连接 方式 的 相似 之 处 。 

(26) 拓展 知识 : Python 还 提供 了 一 个 三 元 运算 符 , 可 以 实现 与 选择 结构 相似 的 
效果 。 

(27) 拓展 知识 : Python 标准 库 datetime。 

(28) 拓展 知识 : 标准 库 calendar 也 提供 了 一 些 与 日 期 操作 有 关 的 方法 。 

(29) 拓展 知识 : 也 可 以 自己 编写 代码 模拟 Python 标准 库 calendar 中 查看 日 历 的 
方法 。 

(30) 拓展 知识 : math 是 用 于 数学 计算 的 标准 库 。 

GD 拓展 知识 : 有 时 候 换个 角度 来 思考 和 解决 问题 ,或许 会 更 加 有 效 和 快捷 。 

(32) 拓展 知识 : 也 可 以 直接 使 用 Python 标准 库 itertools 提供 的 函数 来 解决 组 合 数 
计算 的 问题 。 

(33) 拓展 知识 : 函数 属于 可 调用 对 象 。 

(34) 拓展 知识 : 局 部 变量 的 空间 是 在 栈 上 分 配 的 ,而 栈 空间 是 由 操作 系统 维护 的 ， 
每 当 调 用 一 个 函数 时 ,操作 系统 会 为 其 分 配 一 个 栈 帧 ,函数 调用 结束 后 立刻 释放 这 个 
Feli 

(35) 拓展 知识 : 除了 局 部 变量 和 全 局 变量 ,Python 还 支持 使 用 nonlocal 关键 字 定 义 
一 种 介 于 两 者 之 间 的 变量 。 

(36) 拓展 知识 : 例 3-18 描述 的 实际 上 是 将 列表 循环 左 移 k 位 的 算法 ,下 面 的 代码 使 
用 了 更 加 直接 的 方法 ,但 对 于 长 列表 来 说 效率 不 如 上 面 的 代码 高 。 

(37) 拓展 知识 : 在 Python 3. 5 版 本 中 ,标准 库 math 也 提供 了 计算 最 大 公约 数 的 函 
数 gcd() 。 

(38) 拓展 知识 : 例 3-24 给 出 的 算法 是 快速 排序 算法 中 非常 重要 的 一 个 步骤 ,当然 也 
可 以 使 用 下 面 更 加 简洁 的 代码 来 实现 。 

(39) 拓展 知识 : 函数 递归 调用 。 

(40). 拓展 知识 : 利用 类 数据 成 员 的 共享 性 ,可 以 实时 获得 该 类 的 对 象 数量 ,并 且 可 
以 控制 该 类 可 以 创建 的 对 象 最 大 数量 。 

(41) 拓展 知识 : 在 Python 中 ,函数 和 方法 是 有 区 别 的 。 

(42) 拓展 知识 : 所 谓 多 态 ,是 指 基 类 的 同一 个 方法 在 不 同 派生 类 对 象 中 具有 不 同 的 
表现 和 行为 。 

(43) 拓展 知识 : Python 标准 库 queue 提供 了 LILO 队列 类 Queue, LIFO 队列 类 
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LifoQueue, 优先 级 队列 类 PriorityQueue ,标准 库 collections 提供 了 双 端 队列 。 

(44) 拓展 知识 : 堆 也 是 一 种 很 重要 的 数据 结构 ,在 进行 排序 时 使 用 较 多 ,优先 队列 
也 是 堆 结构 的 一 个 重要 应 用 。 

(45) 拓展 知识 : 转 义 字符 。 

(46) 拓展 知识 : 在 字符 串 格式 化 方法 format() 中 常用 的 格式 字符 。 

(47) 拓展 知识 : Python 标准 库 string 还 提供 了 用 于 字符 串 格式 化 的 模板 类 
Template。 

(48) 拓展 知识 : 实际 开发 时 应 优先 考虑 使 用 Python P E PA CREDE S8 09 75 iE. 
运行 速度 快 ,并 且 运 行 稳定 。 

(49) 拓展 知识 : timeit 模块 还 支持 下 面 代码 演示 的 用 法 ,从 运行 结果 可 以 看 出 , 当 需 
要 对 大 量 数据 进行 类 型 转换 时 ,内 置 函数 map() 可 以 提供 非常 高 的 效率 。 

(500 拓展 知识 : Python 标准 库 中 的 string 提供 了 英文 字母 大 小 写 、 数 字 字 符 、 标 点 
符号 等 常量 ,可 以 直接 使 用 ,下 面 的 代码 实现 了 随机 密码 生成 功能 。 

(51) 拓展 知识 : 在 Python 中 ,字符 串 属于 不 可 变 对 象 ,不 支持 原 地 修改 ,如 果 需 要 
修改 其 中 的 值 , 只 能 重新 创建 一 个 新 的 字符 串 对 象 。 

(52) 拓展 知识 : Python 标准 库 unicodedata 提供 了 不 同形 式 数字 字符 到 十 进 制 数字 
的 转换 方法 。 

(53) 拓展 知识 : Python 标准 库 textwrap 提供 了 更 加 友好 的 排版 函数 。 

(54) 拓展 知识 : Python 扩展 库 jieba 和 snownlp 很 好 地 支持 了 中 文 分 词 ,可 以 使 用 
pip 命令 进行 安装 。 

(55) 拓展 知识 : Python 扩展 库 pypinyin 支持 汉字 到 拼音 的 转换 ,并 且 可 以 和 分 词 扩 
展 库 配 合 使 用 。 

(56) 拓展 知识 : 文件 操作 一 般 都 要 遵循 “打开 文件 一 读 写 文 件 一 关闭 文件 "的 标准 
套路 ,但 是 如 果 文 件 读 写 操作 代码 引发 了 异常 ,很 难保 证 文件 能 够 被 正确 关闭 ,使 用 上 下 
文 管理 关键 字 with 可 以 避免 这 个 问题 。 

(57) 拓展 知识 : 在 交互 模式 下 使 用 文件 对 象 的 write() 方 法 写 入 文件 时 ,会 显示 成 功 
写 入 的 字符 数量 。 

(58) 拓展 知识 : JSON(JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 ， 
易于 阅读 和 编写 ,同时 也 易于 机 器 解析 和 生成 (一 般 用 于 提升 网 络 传输 速率 ) ,是 一 种 比较 
理想 的 编码 与 解码 格式 。 

(59) 拓展 知识 : CSV(Comma Separated Values) 格 式 的 文件 常用 于 电子 表格 和 数据 
库 中 内 容 的 导入 和 导出 。 

(60) 拓展 知识 : 除了 用 于 文件 操作 和 文件 夹 操 作 的 方法 之 外 ,os 模块 还 提供 了 大 量 
其 他 方法 。 

(61) 拓展 知识 : CRC 又 称 为 循环 元 余 检 验 码 ,常用 于 数据 存储 和 通信 和 领域 ,具有 极 
强 的 检 错 能 力 。 

(62) 拓展 知识 : Pywin32 模块 需要 单独 安装 ,这 是 一 个 功能 非常 强大 的 模块 ,提供 了 
Windows 底层 API 函数 的 封装 ,使 得 可 以 在 Python 中 直接 调用 Windows API 函数 , 支 
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FAKE Windows 底层 操作 。 

(63) 拓展 知识 : Python 标准 库 ctypes 提供 了 访问 DLL 动态 链接 库 的 功能 ,很 好 地 
支持 了 与 C/C++ 等 语言 混合 编程 的 需求 ,也 可 以 调用 系统 底层 APT PRÉC 

(64) 拓展 知识 : 系统 运 维 涵盖 的 内 容 非 常 多 ,还 包括 电力 系统 维护 .数据库 维 护 、 磁 
盘 配 额 , 用 户 账号 与 权限 .网络 设 备 与 带宽 分 配 、 病 毒 防护 与 人 侵 检测 、 系 统 资源 分 配 等 。 

(65) 拓展 知识 : 正如 前 面 所 说 ,系统 运 维 涉及 面 非常 广 ,也 包括 系统 中 进程 的 创建 
与 结束 、 系 统 服务 状态 等 。 

(66) 拓展 知识 : Python 程序 编译 与 打包 。 

(67) 拓展 知识 : 回调 函数 原理 。 

(68) 拓展 知识 : 断言 语句 assert 也 是 一 种 比较 常用 的 技术 ,常用 来 在 程序 的 某 个 位 
置 确认 指定 条 件 必 须 满足 , 常 和 异常 处 理 结构 一 起 使 用 。 

(69) 拓展 知识 : 在 工程 界 , 不 管 是 安全 专家 还 是 恶意 攻击 者 ,最 常 使 用 的 漏洞 发 现 
和 挖掘 方法 是 Fuzz, 属 于 * 灰 ?” 盒 测试 技术 ,也 可 以 说 是 一 种 特殊 的 黑 盒 测 试 技术 。 

(70) 拓展 知识 : 有 时 候 可 能 需要 把 代码 执行 过 程 中 的 一 些 调试 信息 .出错 信 息 或 其 
他 信息 记录 下 来 而 不 影响 正常 的 输出 ,这 时 可 以 使 用 Python 标准 库 logging 提供 的 
功能 。 

(71) 拓展 知识 : 软件 性 能 测试 。 

(72) 拓展 知识 : SQL 注入 式 攻击 与 防范 。 

(73) 拓展 知识 : 如 果 想 知道 某 个 IP 地 址 的 详细 信息 ,如 国家 ,城市 、 经 纬度 等 信息 ， 
可 以 使 用 Python 扩展 库 pygeoip 配合 数据 库 GeoLiteCity. dat 来 获取 这 些 信 息 。 

(74) 拓展 知识 : 使 用 Python 查看 本 机 的 IP 地 址 与 网 卡 的 物理 地 址 。 

(75) 拓展 知识 : 发 送 数据 时 ,如 果 目 标 IP 地 址 中 最 后 一 组 数字 是 255 ,表示 广播 地 
址 ,也 就 是 说 局 域 网 内 的 所 有 主机 都 会 收 到 信息 。 

(76) 拓展 知识 : Python 标准 库 socket 除了 支持 UDP 和 TCP 编程 之 外 ,还 提供 了 用 
来 获取 本 地 主机 名 的 gethostname() ,根据 主机 名 获取 IP 地 址 的 gethostbyname O ,根据 
IP 地 址 获取 主机 名 的 gethostbyaddr() ,根据 端口 号 获取 对 应 服务 名 称 的 getservbyport 
〇 ,根据 服务 名 称 获取 对 应 端口 号 的 getservbyname() 等 方法 。 

(77) 拓展 知识 :sniffer pro 是 NAI 公司 出 品 的 一 款 一 流 的 便携 式 网 管 和 应 用 故障 
诊断 分 析 软 件 ,拥有 强大 的 网 络 抓 包 和 协议 分 析 能 力 ,软件 能 够 完美 支持 全 系统 
Windows 平台 ,性 能 优越 ,是 网 络 管理 员 必 备 的 一 款 网 络 协议 分 析 软 件 。 

(78) 拓展 知识 : scapy 是 一 款 功 能 非常 强大 的 交互 式 包 处 理 程序 ,可 以 伪造 或 解码 
很 多 种 网 络 协议 的 数据 包 , 可 以 发 送 和 捕获 数据 包 , 可 以 对 请 求 数据 包 和 回复 数据 包 进 行 
匹配 ,可 以 处 理 扫描 ,路 由 跟踪 、 探 测 .单元 测试 .攻击 、 网 络 发 现 等 任务 ,还 具有 很 多 其 他 
工具 所 不 具有 的 功能 。 

(79) 拓展 知识 : 运行 例 9-4 的 代码 会 发 现 ,虽然 扫描 效果 不 错 , 但 是 速度 非常 慢 , 远 
不 如 xscan 快 。 

(80) 拓展 知识 : Python 扩展 库 netaddr 提供 了 大 量 可 以 处 理 网 络 地 址 的 类 和 对 象 。 

(81) 拓展 知识 : 在 例 9-4 的 代码 中 是 使 用 IP 地 址 来 表示 目标 主机 的 ,但 是 很 多 网 站 
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为 了 防止 黑客 攻击 或 者 进行 负载 均衡 ,会 经 常 变换 主机 ,这 样 同一 个 域名 在 不 同时 间 可 能 
会 对 应 不 同 的 IP 地 址 ,在 这 种 情况 下 可 以 通过 socket 模块 的 gethostbyname O PR ROK 3: 
时 获取 目标 主机 的 IP 地 址 。 

(82) 拓展 知识 : Nmap 是 一 款 非 常 棒 的 网 络 扫描 工具 ,首先 下 载 并 安装 Nmap TH, 
把 安装 路 径 添加 到 系统 Path 环境 变量 ,然后 使 用 pip 安装 python-nmap ,就 可 以 使 用 了 。 

(83) 拓展 知识 : Python 标准 库 ftplib 提供 了 FTP 客户 端的 主要 功能 。 

(84) 拓展 知识 : 如 果 你 仍然 不 舍得 放弃 Python 2. x, 或 许可 以 试 试 Python 扩展 库 
machanize, 这 也 是 一 款 不 错 的 网 页 内 容 读 取 工 具 。 

(850 拓展 知识 : 以 创建 并 启动 线程 的 方式 来 执行 一 个 函数 可 以 实现 多 个 函数 或 功 
能 代码 并 发 或 同时 运行 ,而 直接 调用 函数 的 话 会 阻塞 当前 线程 ,直到 函数 执行 结束 返回 后 
才能 继续 执行 当前 线程 的 代码 。 

(86) 拓展 知识 : 前 面 我 们 已 经 多 次 用 过 Python 标准 库 time 中 的 sleep0 〇 函数 , 它 的 
功能 是 暂停 (或 者 说 阻塞 当前 线程 ) 指 定时 间 ( 单 位 是 秒 ) 。 

(87) 拓展 知识 : 多 线程 技术 的 提出 并 不 仅仅 是 为 了 提高 处 理 速度 和 硬件 资源 利用 
率 , 还 有 就 是 为 了 增加 系统 的 可 扩展 性 (采用 多 线程 技术 编写 的 代码 移植 到 多 处 理 器 平台 
上 继续 不 需要 改写 就 能 立刻 适应 新 的 平台 ) 和 提高 用 户 体验 。 

(88) 拓展 知识 : 在 Windows 7 系统 中 , 单 击 “开始 ”一 计算 机 ?管理 ”命令 ,然后 
展开 “事件 查看 器 ,选择 感 兴趣 的 事件 类 别 并 右 击 , 选 择 * 将 所 有 事件 另存 为 ”, 就 可 以 把 
系统 日 志保 存 为 记事 本 文档 。 

(89) 拓展 知识 : 对 于 贝 塞 尔 曲线 而 言 , 其 特点 在 于 第 一 个 控制 点 恰好 是 曲线 的 起 
点 ,最 后 一 个 控制 点 是 曲线 的 终点 ,其 他 控制 点 并 不 在 曲线 上 ,而 是 起 到 控制 曲线 形状 的 
作用 。 

(90) 拓展 知识 : MD5 算法 属于 单 向 变换 算法 ,不 存在 反 函 数 ,暴力 测试 几乎 成 为 唯 
一 可 能 的 MD5 破解 方法 。 

OD 拓展 知识 : 也 可 以 使 用 ssdeep 工具 来 计算 文件 的 模糊 哈 希 值 或 分 段 喻 希 值 ,或 
者 编写 Python 程序 调用 ssdeep 提供 的 APT 函数 来 计算 文件 的 模糊 哈 希 值 .模糊 哈 希 值 
可 以 用 来 比较 两 个 文件 的 相似 百分比 。 

(92) 拓展 知识 : Python 标准 库 turtle 也 提供 了 很 多 绘图 功能 。 

(93) 拓展 知识 : 对 于 例 15-10 的 程序 有 几 点 需要 补充 说 明 一 下 : 四 通过 socket 进行 
网 络 通 信和 时 收发 数据 包 的 数量 和 大 小 最 好 是 一 致 的 ,要 不 然 会 导致 混乱 而 无 法 正常 监控 ; 
加 如 果 需 要 进行 屏幕 广播 ,需要 使 用 UDP, 可 以 参考 本 书 第 16 章 介绍 的 服务 器 发 现 功能 
代码 ; 加 在 上 面 程序 的 实现 中 ,发 送 端 把 屏幕 截图 转换 为 字 节 串 后 发 送 给 接收 端 ,而 接收 
端 接收 完整 个 屏幕 截图 后 还 原 为 图 像 进行 显示 ,这些 操作 都 是 在 内 存 中 进行 的 ,如 果 同 时 
监控 多 个 客户 端 ,可 能 会 占用 监控 端 大 量 的 内 存 , 可 以 接收 截图 的 内 容 后 不 存储 在 内 存 中 
而 是 写 人 磁盘 文件 来 缓解 监控 端的 内 存 压 力 ; 田 每 次 收发 数据 包 的 大 小 不 能 太 大 或 太 
小 ,如 果 太 大 可 能 会 因为 出 错 引 起 的 频繁 重 传 而 降低 效率 ,如 果 太 小 则 会 因为 额外 开销 
(在 网 络 体 系 结构 中 ,发 送 端 数据 包 每 往 下 一 层 就 会 加 一 层 “ 皮 ”, 而 接收 端 每 往 上 一 层 就 
会 为 数据 包 去 掉 一 层 “ 皮 ”, 这 些 “ 皮 ”是 有 开销 的 ) 太 大 而 降低 效率 。 
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